自動車業界関係者であれば、J.D.パワー社が毎年発表する米国自動車初期品質調査(IQS)をご存知だと思います。ここ数年、IQSではヒューマン・マシン・インタフェース(HMI)のユーザビリティに関連した問題の指摘が増えており、Nuance Communicationsが独自に行った車載インフォテインメントの評価においても、同様の課題が明らかになっています。今回、さまざまな評価検証から得られた情報を元に検討した、車載インフォテインメントにありがちな5つのユーザビリティの課題とその対策を複数回にわたって紹介します。

落とし穴・その1:入力が低品質であること(音声認識およびタッチ入力)

"Garbage in, garbage out."-「ゴミを入れればゴミしか出てこない」ということわざのように、低品質の入力ではユーザー体験の品質も低下してしまいます。

まずは画面のタッチ入力から考えてみましょう。初期のタッチスクリーンを使った車載インフォテインメントでは、解像度が低く処理速度も遅いため、入力操作に対する反応が遅れることもありました。ドライバーが画面を注視することができない車載インフォテインメントの利用シーンで、そんな状況が起きていると想像してみてください。こういった問題を避けるために、車載インフォテインメントには高解像度で高い分解能を持つタッチスクリーンと、素早い反応速度を実現するためのパワフルなCPUが必要です。

音声認識にとっては、入力音声の品質は非常に重要です。ユーザーが発話した音声コマンドを誤って認識してしまっては、優れたユーザー体験を提供することはできません。J.D.パワー社の調査に話を戻しますと、車載インフォテインメントが自分の音声コマンドを正しく理解してくれない、という不満がしばしば見られます。この問題を分析すると、マイクから取り込まれる音声信号のSN比の問題、ユーザーが音声コマンドを話し始めるのが早すぎる、発話の単語と単語の間が長すぎる、ユーザーの発話と同乗者の会話が重なっているといったさまざまな要因が、誤認識の問題をいっそう複雑にしています。

このような環境要因は、音声認識の一番最初の工程にあたる音声信号処理にとっては厳しい条件ですが、高性能なマイクを車室の音響特性を考慮した最適な場所に設置することが基本になります。これに加えて、Nuanceの音声信号処理技術「VoCon SSE(Speech Signal Enhancement)」を利用することで、走行ノイズの抑制とユーザー以外の発話のキャンセルなどが可能となり、結果として音声認識の精度の向上が期待できます。

音声信号処理(SSE)を活用することで、走行ノイズの抑制やユーザー以外の発話をキャンセルすることが可能となり、音声認識精度を高めることができるようになる

また、音声認識とあわせて自然言語理解(NLU)を利用することで、さまざまな問題を改善することができます。NLUは、文章の構造や単語の順序などの要因をもとに統計的な分類処理を行い、発話の意図を推測してキーワードを抽出します。そのため、音声認識で抜けてしまった言葉や想定していない言葉があった場合でも、ユーザーが望んでいる結果にたどり着く可能性が高くなります。

優れたユーザー体験を提供するために

以上のような問題とその対策は、あまりにも当たり前のようにも見えるかもしれません。しかし、あえて最初の落とし穴として取り上げたのは、これが信頼できるユーザー体験を提供するための基礎だからです。もし、次回以降に紹介する残りの4つの落とし穴すべてを回避することができたとしても、入力の品質に問題が残っていれば、結局はユーザー体験に悪影響を与えてしまいます。

次回は4月6日に掲載予定です

著者プロフィール

Adam Emfield(アダム・エンフィールド)
Nuance Communications
オートモーティブ・ビジネスユニット
プリンシパル・ユーザーエクスペリエンス・マネージャー

約10年間、人間工学、エンジニアリング、コンピュータサイエンスなどの分野を専攻後(修士号取得)、Nuanceにおいて車載機器のユーザーエクスペリエンスおよびユーザビリティに関する研究を主導。
現状の分析を通じて革新的な新しいアイデアを導き、Nuanceのユーザー視点を考慮した提案活動に従事