Microsoftはこのたび、Windows OS Platform Blog「Introducing GPU Innovations with Windows Server 2025」において、Windows Server 2025およびAzure Stack HCI 24H2に搭載される予定の高度なGPU機能について解説を行った。Nvidia GPUとの連携で実現するこれらの新機能により、Windows Server上でのAIタスクを高度かつ柔軟に制御が可能になり、ワークロードの大幅な向上が期待できるという。
フェイルオーバー クラスター内でのDDAのサポート
Discrete Device Assignment(DDA)は、仮想マシンに物理デバイスを個別に割り当てて直接制御できるようにする機能。Windows Server 2025では、フェイルオーバークラスタ内でDDAがサポートされ、GPU全体を個々の仮想マシンに容易に割り当てられるようになる。
これによって、クラスタ化された仮想マシン内でもミッションクリティカルなAIワークロードを簡単に実行できるようになるという。計画的なメンテナンスや予期しない障害によって仮想マシンがクラスタ内の別のノードで再起動された場合でも、自動的にそのノードのGPUが使用されるため、継続してタスクを実行できる。
GPUパーティショニングによるリソース利用の最適化
Windows Server 2025にはGPUパーティショニング(GPU-P)と呼ばれる新しい機能が搭載される予定となっている。GPU-Pは、単一の物理GPUを複数のパーティションに分割し、各パーティションをフェールオーバークラスタ内の個別の仮想マシンに割り当てられるようにする機能である。仮想マシンがクラスタ内の別のノードで再起動した場合は、自動的にそのノードのGPUパーティションが使用される。これによって、リソースの使用率の最適化が実現できる。
さらに、Windows ServerのGPU-Pではライブ マイグレーション機能もサポートされる予定となっている。GPUパーティションが割り当てられた仮想マシンは、実行中のワークロードに影響を与えることなくノード間を移動できるため、仮想マシンを停止させることなくハードウェアのメンテナンスやソフトウェアのアップグレードを行える。
Windows 管理センターによる仮想化GPUの集中管理
Windows 管理センター(WAC)では、仮想化されたGPUを集中的に管理する機能が提供される。管理者は、スタンドアロン クラスターとフェールオーバークラスタの両方に対して、GPUパーティションの表示や構成、仮想マシンへの割り当てなどを管理することが可能となる。
現在はプレビュー版が試用可能
Windows Server 2025 DatacenterおよびAzure Stack HCI 24H2は、2024年後半に一般提供が開始される予定となっている。本稿執筆時点では、Windows Server 2025のパブリックプレビュー版が公開されており、次のサイトよりISO形式またはVHD形式のファイルをダウンロードして試用できるようになっている。(関連記事:次期Windows Serverとなる「Windows Server 2025」プレビュー | TECH+(テックプラス))
Microsoftでは、Windows Serverのユーザーに対してプレビュー版を呼びかけている。