日立ソリューションズ東日本は6月21日、テキスト情報を分析し、業務改善につながる気づきを見つけるためのテキストマイニングツール「CoreExplorer(コアエクスプローラー)」において、主な分析機能の一部をAPIオプションとして提供を開始したと発表した。
同ツールは、特徴的な単語や使用頻度および相関関係などを可視化し、短時間でより細部まで踏み込んだ高度なテキスト分析を可能にするため、ビジネスの改善につながる「気づき・発見」を効率的に見出すことができることから、多くのITベンダーより、同じツールが保有するテキスト解析機能を自社の他システムや製品に組み込みたいという要望が寄せられていたという。
そこで今回、同ツールの機能のうち、対象機能のみを呼び出して使用できる「APIオプション」として提供。これにより、ツールに取り込んだまま保持しているテキスト解析データに対し、WebAPI(REST)で簡単に情報を抽出することができるようになる。WebAPをI利用するための仕様書も提供するため、WebAPI経由で「CoreExplorer」にアクセスすることで、テキストマイニング技術を使ったシステム開発や製品への組み込みなどを容易に行うことが可能。
APIオプションは、「CoreExplorer(分析画面・管理画面)+WebAPIオプション」「CoreExplorer(管理画面)+WebAPIオプション」の2パターンで提供される。
主な提供機能は、「キーワードランキング(検索条件にヒットした、文書内で使われている単語を多い順に取得)」「係り受け抽出(文書内の単語において、単語の間の修飾・被修飾の関係を抽出)」「自動分類(任意のテキストデータを分類ルールに従って分類)」「文書クラスタリング(単語の出現パターンが似た文書をグループ化)」「全文検索(指定した検索条件にヒットした文書を検索)」「類似検索(指定した文書と類似した文書を検索)」「マトリクス集計(データ内の属性と単語を軸とした、マトリクス集計を実行)」「急上昇ワード抽出(指定した区間で急激に上昇した単語を抽出)」。
主な活用例として、「社内ホームページ上に、営業報告書やコールセンターのキーワード情報を掲載」「自動分類機能により、重要キーワードを検知」などが考えられるという。