米サンフランシスコ市でNVIDIAが開催中のGPU TECHNOLOGY CONFERENCE(GTC)にて、NVIDIA社長兼CEO、ジェンスン・フアン(Jen-Hsun Huang)氏による基調講演が行われた。
NVIDIA、3本柱の製品ライン
フアン氏は、まず、NVIDIA製品ラインナップの基本コンセプトについて解説した。
1つは「Quadro」。これはクリエイター向けのOpenGLフォーカスなGPUで、ビジュアルコンピューティング向けのソリューションとなる。
そして2つ目は躍進著しい「Tesla」シリーズ。これはデータパラレルコンピューティング向けのソリューションで、サーバやクラウドのコンピューティングパワーをアクセラレーションするためのもの、と言う位置付けになる。
3つは、説明不要のコンシューマ向けGPU「GeForce」のラインだ。ただし、フアン氏は、このコンシューマ向けラインに新たなメンバーを加えている。それはSoC(System On a Chip)製品の「Tegra」シリーズだ。Tegraは携帯電話、タブレット等の携帯情報機器への搭載を想定したもので、GeForce系GPUコアとARM系CPU、その他のメディアプロセッサなどの機能を統合している。
「Tegraによって提供されるモバイルコンピューティング(携帯情報機器)はこれまで無かったものだ。基本的なコンピューティング機能以外にカメラ、マイク、GPSなどのセンサーの類を内蔵している。まさに現在の状況をセンシングするためのマシンだと言える。そして、これらが取得したデータに対し高度な情報処理を行うのがクラウド側にあるTESLAということになる。そしてPCのGeForceは高度なメディア能力を提供し、ワークステーションのQuadroは卓越したクリエティビティを提供する」(フアン氏)
フアン氏はこう述べ、NVIDIAのGPU技術は、各セグメントで効果的に活かされていることを強調した。
NVIDIA、CUDAの成功を振り返る
「我々は、4年前、GPUを汎用目的に利用できることを目的としたCUDAアーキテクチャのGPUを投入した。これはCPUに置き換わるものではなく、CPUに加わるものとして、コンピューティングパワーを増強することに貢献する」(フアン氏)
振り返ってみれば、GeForce 8800 GTX(G80)は、まさしくNVIDIAのGPUアーキテクチャの大きな転換期だった。G80は、それなりに評価の高かったGeforce 6000/7000系からの流れに見切りを付け、DirectX 10フィーチャーに対応させるだけでなく、GPGPU用途対応に大きく舵取りをしたからだ。
結果、G80はデータパラレルコンピューティングのアクセラレーションに貢献しただけでなく、GPGPUを一般ユーザー向けに認知させることに成功した。ここはNVIDIAの大きな功績と言っていいだろう。
なお、NVIDIAは、この独自のGPGPUプラットフォームにCUDA(Compute Unified Device Architecture)と命名した。
「一般的なアプリケーションにおいて、実際には、データパラレルコンピューティングの部分はプログラム全体の5%に過ぎない。しかし、ランタイム時間でこの5%のコードが繰り返し繰り返し支配的に動作していたらどうなるか。そうなれば、そのアプリケーションは、プログラム実行に占める全体の90%以上がデータパラレルコンピューティングを行っていることになる。こうしたアプリケーションは実際にはかなりある。これらをアクセラレーションするのにCUDAのアーキテクチャは最適だった」(フアン氏)
NVIDIAのCUDAアーキテクチャ(CUDAのAがアーキテクチャの意をなすが、GPU世代を言い表す場合、しばしばCUDAアーキテクチャという言い回しは用いられる)が、新しいコンピューティングパラダイムであったのに、わずか4年ほどでここまで浸透したことには、フアン氏は2つの理由があったと分析する。
1つは、それまでのコンピュータのアーキテクチャを大きく変えるものではなかったという点。どういうことかというと、CUDAという発想自体は新しかったが、その実装形態は「従来のマルチコアCPUシステムにGPUを搭載する」というもので、物理的には何も変わらなかった。人々は大きな変革には警戒心を抱くが、CUDAは物理的には何も変わらなかったために、うまく浸透できたというわけだ。
もう一つは、CUDAアーキテクチャを、当初はごく親しまれたGPUブランドである「GeForce」ブランドでユーザーに届けることが出来たという点。ユーザーはCUDAアーキテクチャであることすら意識せず、CUDAアーキテクチャのGeForceを買い求めることになり、気がついてみれば年当たり1億台のPCにCUDAベースのGeforceが載って出荷されることになり、10億ドルものの開発費を廻しても回収できる市場性を維持しつつ、CUDAを普及させることが出来たというわけだ。
「越えがたき壁」を超えるためのCUDA
その昔、トランジスタが高価であり、演算コストが高いものとされたが、現在はトランジスタや演算はタダ同然となり、メモリアクセスの遅さこそが近代コンピューティングにおける問題点となってきた。また大きい消費電力は「悪」という認識も浸透しつつある。
こうした状況の中で、バークレー大学のDavid A. Patterson氏は、2007年、コンピュータアーキテクチャにまつわる「新しい共通認識」を提唱した。
それが「電力の壁+メモリの壁+命令レベル並列化の壁=越えがたき壁」というものだ。要するに、「消費電力、メモリアクセス速度、多数命令の同時実行によるパフォーマンス向上にまつわる事実上の限界によってコンピューティングパフォーマンスが頭打ちになるだろう」ということをいっているのだ。
今後の「この壁」が立ちはだかり、このままでいくと、90年代に年率50%の性能強化が果たされてきたコンピューティングパワーは、年率20%程度に打ち止めとなり、今からあと10年もすれば、90年代の伸び率換算で100分の1の性能向上に留まってしまう……というのだ。
「この壁」を乗り越える、あるいは破壊する手段として有効なのが、コンピューティングパラダイムそのものの革新であり、その1つの有効手段とされるのか「並列化」(Parallelism)ということになる。
このコンピューティングのパラダイムシフトを手助けする、起爆剤となるのがCUDAである……というのがフアン氏の論調だ。
現在の標準的なPC環境にCUDA環境をトロイの木馬的にすんなりと配備することに成功し、アマチュアからプロフェッショナルまで、あるいは、民生用から業務用にいたるまで、データパラレルコンピューティング環境を整備したのはNVIDIAである……というのだ。
「アメリカのコンピュータ学者、Daniel A. Reed氏は、こう言った。コンピューティングは『第三の科学の柱』になる……と」(フアン氏)
科学の二本柱は「理論と実験」、あるいは「推論と観察」などといわれるが、これに加え、現代科学にはコンピューティングが第三の柱に加わった……と提唱したのがDaniel A. Reed氏だ。
「科学はコンピューティングによって支えられ、NVIDIAはそのコンピューティングの基盤をCUDAベースのGPUテクノロジーで支えていくのだ」(フアン氏)
(トライゼット西川善司)