NECは11月28日、事象を音で認識する「音状況認識技術」を開発したと発表した。

音には障害物の向こう側など目に見えない状況を認識できる特性があるため、認識対象の音(目的音)に注力した音認識技術の開発が進められてきた。しかし、広い範囲を対象とした際、認識対象以外の音(環境雑音)によって目的音の検知感度や認識精度の低下してしまうことが課題となっていた。

NECが開発した「音状況認識技術」はマイクで収集した音を目的音と環境雑音に分け、目的音から細かい構成音を抽出する構成音抽出技術と、構成音の組み合わせパターンから事象の有無を判別する事象判別技術で構成される。例えば、「ガラスが割れた」という事象で発生する音は、「ガシャン」「パリン」「バリン」など環境によって音が変化するが、これをあらかじめ学習させていた「ガ」や「シャ」、「パ」「バ」など環境の違いに影響しない細かな構成音に分け、学習させていない未知の音の成分を環境雑音に分けることで、環境雑音の影響を受けない高精度な構成音の抽出を実現する。また、「ガ」や「シャ」などの構成音の組み合わせを事象パターンとしてあらかじめ学習し、校正音抽出技術で高精度に抽出した構成音と照合することで、目的とする事象の有無を判別する。これにより、「ガラスが割れた」「罵声が上がった」「悲鳴も出た」などの事象から、喧嘩の状況などを認識することが可能だという

「音状況認識技術」の概要

なお、同技術は音響検知の国際コンテスト「DCASE2016」において雑音中の日常音検知部門で第1位を獲得したほか、NECの検証では従来技術に比べて5倍の距離でも十分な検知ができることを確認した。

同社は「音状況認識技術」により、公共施設や観光地における犯罪・事故の検知や、高齢者宅の生活音による緩やかな見守りなど様々な環境における危険状況の高精度な認識を実現するとしている。