デジタル音声アシスタントのサービス向上や学習のための会話データ分析がプライバシーを侵害していると指摘された問題で、米Googleがプライバシー保護を徹底した形で運用するための対策を公表した。
この問題は、デジタル音声アシスタントを提供する企業が技術やサービスの改善のために録音した会話データのサンプルを用い、それを社員ではないコントラクタも聴き、その事実がユーザーに十分に知らされていないことに批判の声が上がった。ユーザーの中には、会話データの収集を拒否したいユーザーがいれば、内容を把握した上で協力を希望するユーザーもいる。サービス提供企業は、全てのユーザーのプライバシーを保護しながら、個々のユーザーが意図した形で透明に、データが音声アシスタント技術の発展に活用される仕組みを作らなければならない。
Googleアシスタントの場合、ユーザーがVoice & Audio Activity (VAA: 音声アクティビティ)を有効にすると、録音したデータがGoogleアカウントに保存されるようになる。それによってGoogleアシスタントはユーザーの声を学習してユーザーをより正確に認識するようになり、音声データから生成したサンプルの分析によってGoogleの音声認識性能が改善する。ユーザーが自身の判断で有効にするオプトイン形式を採用しているが、誰かに聴かれる可能性を認識せずに協力していたユーザーが少なくなかった。そこで、VAAを有効にする設定画面において、技術改善のために人間のレビュワーが聴く可能性があることをハイライトして明示する。すでにVAAを有効にしたユーザーに対しては、新しいVAA設定とそれぞれの設定内容を確認するように求める。
騒々しい環境で「Hey Google」に似た音をGoogleアシスタントが誤認識し、ユーザーが意図しない起動が起こる恐れもある。そうした録音がデータ分析に用いられないように、Googleはユーザーの意図しない起動を見分ける手段を重ねて導入し、誤動作についてはすぐに録音を自動削除している。さらに、Googleアシスタントが「Hey Google」を認識する感度をユーザーが変更できるオプションをまもなく追加する。騒がしい場所における意図しない動作を減らしたり、逆に騒音の中でもアシスタントがよく反応するように調整できる。
また、Googleがストアするデータを最小限にする目標に従って、Googleアシスタントについてもストアする音声データを大幅に減らすようにポリシーをアップデートしている。VAAにオプトインしたアカウントでは、数カ月の期間を経て古くなったデータは大部分が自動的に削除される。この新ポリシーは今年後半にVAAに反映される。