新型UIを模索するMicrosoft

Gates氏がSurfaceやTablet PCを頻繁に取り上げることから分かるように、最近のMicrosoftは特にユーザーインタフェースの改良と新機軸の開発に力を注いでいる。同社がタッチ型インタフェース以外で着目しているのが音声認識だ。例えば車を運転している場合など、オーディオパネルに視線を移すのは危険な行為だ。一歩間違えれば大事故にもつながり兼ねない。MicrosoftはFordなどの自動車メーカーと共同で携帯デバイスと車載オーディオが連携するシステムなどを開発しており、こうした仕組みをさらにユーザーフレンドリーにするのは自然な流れかもしれない。オーディオの操作パネルをハンドル付近に配置したり、音声認識でプレイリストの検索や変更を指示したりなど、ほぼハンズフリーで操作できるようにするのはその一例だ。

車内のハンドルの部分にオーディオコントロール用のパネルがついており、視線移動なしでも操作が可能

音声認識で車載オーディオのプレイリストの検索やオーディオトラックの操作が可能

同様の技術は携帯電話にも応用できる。PC等に比べてインタフェースの乏しい携帯電話にとって、音声認識は非常に便利なインタフェースだ。例えば店舗検索を行う場合など、いちいち入力項目に必要な文字情報を手入力するよりも、音声ガイダンスに伝えたほうが素早く結果が得られることも多い。同社は2007年3月に音声ガイドシステムを開発する米Tellme Networksを買収しており、最新のWindows Mobile 6ではTellmeとの連携機能を標準サポートしている。

Tellmeの音声ガイドシステムを使って近場にある映画の上映情報とチケット予約を行う

音声認識以外ではパターン認識も興味深い。例えばいまの携帯電話では多くの機種に小型カメラが内蔵されているが、ここに画像情報を読み込ませて情報を検索したり、携帯に指示を送ったりする。Gates氏の紹介したデモは、人物をカメラで認識させて個人プロファイルを取得したり、ラスベガスの画像を読み込ませて店舗検索や道案内を行ったりなど、非常にシンプルな手順で目的の情報を得られるというものだ。あくまでデモ用の素材なので実用的なものではないが、新しいインタフェースとしては面白いといえる。

Gates氏が手持ちの小型デバイスを使って背景に投影されたラスベガスの風景をスキャン。情報検索を画像情報を基に行う

Robbie Bach氏をスキャンすると個人プロファイルが表示される。「Owes me $20」とは"20ドルの貸し"があるということ

店舗の画像をスキャンすると、その店舗情報とともに当該の場所への距離と道順を案内してくれる

キーノート会場となったホテルをスキャンすると、自身の行動予定をリマインドしてくれる