NVIDIAは10月10日(ドイツ・ミュンヘン時間)、データ分析およびマシンラーニング向けのGPUアクセラレーション プラットフォーム「RAPIDS」を発表した。
オープンソースソフトウェアのRAPIDSは、クレジットカード詐欺の予想や小売り在庫の予測や顧客の購入行動を理解するなど、複雑なビジネス課題に取り組むデータサイエンティストのパフォーマンスを向上させるという。データ分析におけるGPUの重要性が認識されることを反映し、DatabricksやAnacondaといったオープンソースコミュニティのパイオニアから、Hewlett Packard Enterprise(HPE)やIBM、Oracleなどの多くの企業がRAPIDSを支持している。
RAPIDSは、GPUでアクセラレートした分析やマシンラーニング、データの可視化にオープンソースライブラリを提供し、データサイエンティストがGPU上でデータ分析パイプラインをすべて実行するために必要なツールとしては、初になるという。
マシンラーニング用サーバの「NVIDIA DGX-2」システムでのトレーニング用にXGBoostマシンラーニングアルゴリズムを使用した初期のRAPIDSベンチマークでは、CPUのみのシステムと比較して50倍のスピード向上を実現しており、データサイエンティストはデータセットのサイズにより数日間を要していたトレーニング時間を数時間、あるいは数時間を数分にまで、削減することを可能としている。
RAPIDSは、Apache Arrowやpandas、scikit-learnなどを含む一般的なオープンソースプロジェクト上でPythonデータ分析ツールチェーンにGPUアクセラレーションを追加することで構築。RAPIDSにマシンラーニングライブラリや機能を追加するため、Anaconda、BlazingDB、Databricks、Quansight、scikit-learn などのオープンソースエコシステム提供者のほか、Ursa Labs代表でありApache Arrowおよびpandasに加え、Pythonデータ分析ライブラリを手がけたウェス・マッキニー氏の協力を得ている。
今後、幅広い採用を目的もNVIDIAはRAPIDSを解析およびデータ分析用としてオープンソースフレームワークのApache Arrow Sparkに統合を予定している。
なお、RAPIDSオープンソースの一連のライブラリへのアクセスはhttp://www.rapids.aiからすぐに利用でき、コードはApacheライセンスのもとでリリースされている。RAPIDSのコンテナバージョンは、NVIDIA GPUクラウドコンテナレジストリで利用が可能になっている。