野村総合研究所(NRI)は2月28日、フォーマットが異なる複数の文書から人工知能(AI)を活用して自動的にデータを抽出し、後続のシステムへ連携するためのソリューションである「Shingan」を販売開始した。利用料金は、導入と稼働までのコンサルティング料が100万円(税別)~、月額利用料が30万円(同)~。

  • Shinganによる非定型データ抽出の流れ

    Shinganによる非定型データ抽出の流れ

同社は、AIやRPA(Robotic Process Automation)などのデジタル技術を活用し、各組織の業務特性に応じて業務プロセスを高度に効率化するためのソリューションやサービス開発を「Intelligent Process Automation」(IPA)というコンセプトで進めている。

新ソリューションは、従来から用いてきた形態素解析や構文解析といった日本語処理技術と、近年応用が広がっている機械学習やディープラーニング技術との組み合わせにより、自然言語から固有表現を抽出して非定型データをシステムで取り扱えるデータに整え、後続のシステムへの連携を可能にするという。

まず、後続のシステムで取り込むため、非定型データからMicrosoft Excelの形式でデータを抽出し、結果を出力する。抽出したデータと抽出したデータの確度は、ダッシュボード画面で確認することが可能。

  • ダッシュボード画面

    ダッシュボード画面

読み込む文書の特性に応じて事前に学習させた、最適なAIと辞書を抽出に利用し、そのデータ抽出の確度をさらに向上させるため、AIと辞書の最適な組み合わせ設定を同社が継続的にサポートするという。

販売開始に先立ち、同社はフォーマットが異なる文書を多く取り扱う投資信託における各種業務を対象に実証実験を行った。

野村アセットマネジメントと運用報告書に記載されている各種文章の整合性チェックについて、また、NRIプロセスイノベーションとは項目の抽出と他システムへのデータ連携について検証したという。

実証実験で得た知見を活かして、同ソリューションでの確度向上や機能強化・改善などに引き続き取り組んでいく予定だ。