NECは2月19日、特定フレーズに依存しない非定型の音声データを用いるテキスト独立方式における声認証技術を強化し、認証時間を10秒から5秒に半減、認識精度を90%から95%に向上したと発表した。

今回、深層学習を用いた新手法を開発するとともに、学習用音声データの話者数を5倍に拡張することで、自然会話による認証時間を10秒から5秒へ半減した。

あわせて、背景雑音や劣悪な通信環境下での電話会話、複数話者の声が混在する状況など人でも聞き分けることが困難な環境で従来10%程度であった誤認証率を5%に半減し、95%という高精度な個人認識が可能になった。

同技術は、特定のフレーズに限らない短い発声からでも個人の特徴を正確に抽出・識別することができるため、音声を利用した簡便なユーザーインタフェースでの高いセキュリティを実現するという。

同社は今後、同技術を、コールセンターなどの顧客応対業務、他の生体認証などとの連携によるEコマースやテレホン/ネットバンキングでの決済手続き、音声鑑定のような犯罪捜査支援などへ応用することを視野に、2020年の実用化を目指す。