NTTは2月13日、ビッグデータ分析の新たな潮流であるグラフデータ分析処理において、従来技術を数十倍以上高速化する世界最高速の分析技術を開発したと発表した。この技術により、これまで膨大な時間を必要とした日本の人口規模のソーシャルグラフを3分で、世界最大規模の10億ノードのグラフデータを1時間で分析する事も可能になるという。

今回、NTTソフトウェアイノベーションセンタでは、大規模なグラフデータを高速に分析可能な「世界最速のグラフデータ分析処理技術」を開発。ビッグデータの分析において主要な技術である「クラスタ分析技術」および「パーソナライズドページランク技術」を用いて、グラフ構造を階層的に集約しながら分析処理を実行することで不要な処理を削減しデータをコンパクト化することで従来技術の数十倍以上の高速化を達成した。

クラスタ分析技術は、グラフデータの持つ統計的な情報の変化を動的に捉え、分析しながら計算順序を自動最適化する技術で、最適化された計算順序に基づきグラフデータを逐次的に集約し、データ量を削減しながら分析を行う為、本技術を用いるデータの集約パターンは精度劣化が生じないことが証明されている。高い分析精度を維持したまま、計算時間の大幅な短縮が可能となる。

クラスタ分析技術のポイント

パーソナライズドページランク技術は、ノードの重要度がグラフデータの隣接行列を用いて計算可能であることを利用し、グラフデータのノードを最適に並び替えてから行列分解することでグラフデータをコンパクトな行列へと変換する技術。コンパクトな行列において重要度の低いノードを枝刈りすることにより、重要度の高いノードのみを高速に計算する。

パーソナライズドページランク技術のポイント

今後は、より大規模なグラフデータへの適用を目指したデータ圧縮技術、より高速なグラフデータ分析の実現に向けた高速化並列化技術などを用いて、本技術の適用領域拡大につとめ、本技術の応用例として大規模なソーシャルグラフ・人間の行動履歴を利用することで、新たなソーシャルコミュニケーション支援への応用、商品レコメンデーション、医療・公共・社会科学分野への適用を進めていく。