NTTデータは1月27日、人工知能を用いて、アナウンサーが読み上げる気象ニュース原稿を気象電文から自動生成する実証実験を2016年9月から4カ月間にわたり、実施したと明らかにした。
今回の実証実験では、難易度が高い文書自動生成に挑戦し、自動生成された原稿の品質が実用に耐えうるかの検証を行い、気象庁が過去に公開した気象電文と、過去にアナウンサーが読んだ気象ニュース原稿をセットにして学習する仕組みを構築し、過去4年分の気象電文から気象ニュース原稿を生成する規則を学習。また、NTTグループのAI「corevo」の日本語解析技術を組み合わせることで、自然な日本語の生成を実現しているという。
これにより、自動生成された気象ニュース原稿の「日本語文法の正しさ」と「意味の正しさ」を評価した結果、「日本語文法の正しさ」は、4点満点中3.86点(NTTデータ独自の採点基準)で、人が読んでも違和感が無いレベルに達し、「意味の正しさ」は、4点満点中3.07点(同)で、自動生成された気象ニュース原稿をわずかに修正することで、元の気象電文と矛盾しないレベルに達していることを確認した。
システムの特徴とメリットとして「システム開発コストの低減」「原稿作成業務の効率化」「ニュース配信の速報性向上」の3点を挙げている。
システム開発コストの低減は、ディープラーニング技術を用いることで、開発者が個別の処理方法を設計・開発することなく、大量の教師データ注から規則性を学習し、原稿を自動生成できるようになることに加え、教師データの種類を変更すれば、そのデータに対応して文書を自動生成することが可能。
そのため、ベースとなる教師データがあれば、気象以外にも企業の決算発表やスポーツ記事などに応用することも可能となり、開発者が個別の処理方法の設計・開発に要するコストを低減するとしている。
原稿作成業務の効率化に関しては、AI記者が気象電文からニュース原稿を自動生成するため、人間の記者は1から原稿を作成する必要がなくなり、原稿作成業務の効率化が可能になるとしている。
ニュース配信の速報性向上に関しては、AI記者は入力データを基に記事を自動生成することが可能なため、速報性が求められるスポーツニュースや災害情報のリアルタイム配信、地方のニュースの配信ができるという。
同社では実証実験の結果を踏まえ、今後は「意味の正しさ」を向上させるほか、AI記者の気象分野における商用化を目指すとともに、企業の決算発表やスポーツ記事等の大量のデータを伴う分野においても新たな実証実験を行い、AI記者の他分野展開を目指していく。