富士通研究所は8月21日、データ分析の専門家が創出した分析シナリオ(テンプレート)の中から、分析対象データの内容や特性に合わせて適応可能なテンプレートや利用可能な追加データを自動的に推薦する技術を開発したと発表した。
今回開発した分析テンプレート自動推薦機能では、データ分析の専門家が創出した「どのようなデータを組み合わせて利用するのか」「分析結果をどのように解釈・活用するのか」といった分析シナリオを、分析テンプレートとして蓄積・再利用する。そのため、蓄積された分析テンプレートを活用することで、高度な知識やノウハウを持っていなくても、簡単に分析・予測業務を実施することが可能となる。
開発した技術の特徴は、「データモデルに基づく分析テンプレート管理」、「データプロファイリングに基づく分析テンプレート自動推薦」、「組み合せて利用可能な追加データの提示」の3点。
分析プロセス(分析の処理手順)を、データ加工や分析処理を部品化した「分析部品」を組み合せた「分析テンプレート」として設計することで、分析の専門家のノウハウが、分析部品の組み合わせや分析部品のパラメータとして表現されたものとなる。分析テンプレート作成時に、業務・業種カテゴリーや分析目的といったメタデータや、分析対象データの内容や特性を標準的に記述する「データモデル」と対応付けることで、分析テンプレートの自動推薦を実現する。
分析対象データの内容や特性に合わせて分析テンプレートを自動推薦する新しい仕組みでは、分析対象データを指定すると、データプロファイリング技術を利用して、データの内容(各データ項目の意味)や特性(データ量・分布などの性質)を抽出・判定する。このプロファイリングされた内容・特性を、分析テンプレートと対応付けられているデータモデルとマッチングすることで、分析対象データに適用可能な分析テンプレートの自動推薦を実現。
分析テンプレートの自動推薦の際、指定された分析対象データのみ利用可能な分析テンプレートに加え、別のデータを追加することで適用可能になる分析テンプレートの探索を行う。この「別のデータ」を提示することで、異種・多様なデータの組み合わせパターンを見つけることが可能となる。
同技術により、分析の専門家のノウハウを再利用し活性化することが可能となり、データプロファイリングによる自動推薦により、分析対象データさえあれば、業務・業種や分析に関する深い知識やノウハウがなくても、「分析対象データから分析テンプレートを探して適用」、「組み合せ可能なデータを追加して再適用」といった分析プロセスをスパイラルに回していくことが可能となる。
同技術は、富士通がリリース予定の分析ソリューション構築のためのミドルウェア「Interstage Business Analytics Modeling Server」に順次装備されていく予定。