ネットワークを利用するビデオ検索や音声認識

「通信会社として重要なのは、通信ネットワークで情報を送受信するだけではなく、信頼できる情報を引き出し、使える形にすることも重要だ。だからAT&T Labsは通信だけではなくメディア技術、音声認識、自然言語理解、統計データ処理、データマイニングなどにも取り組んでいる」とCambron氏は言う。例えば、ビデオにインデックスを振っておき、ビデオ検索に使うこともできる。ここに音声認識技術も使えば、目的とする映像を見たい場合には、音声で検索するキーワードを読み上げ、ビデオを検索できるようになる。

加えて、さまざまな映像を送受信する場合にはトランスコーディング技術が重要になる。例えばビデオカメラで独自に映像を撮り、カメラからリアルタイムでパソコンやHDTVに流す場合、圧縮技術の変換が必要になることがある。トランスコーディングは例えばH.264からMPEG-4に変換するような技術である。

音声認識では、そのプラットフォーム「WATSON」の研究を進めており、モバイル機器で使えるようにしようと取り組んでいる。音声で動作するようなデバイスとAT&Tネットワークを利用して認識結果を送信するような仕組みを構築中だ。例えば、家庭内のリモコンをすべて音声入力デバイスに替え、見たいテレビ番組や録画してあるコンテンツを音声で読み出すことができる。この場合、リモコンデバイスから検索したいキーワードの音声をインターネットでAT&Tのクラウドコンピューティングセンターへ送り、コンピュータで検索した結果をインターネットでリモコンデバイスに送り返すということで、リモコンに負担をかけずに短時間で音声検索ができる。

AT&Tの世界のネットワークやVPN(仮想専用回線ネットワーク)を利用するとクラウドコンピューティングが極めて現実的に使えるようになる。クラウドコンピューティングは、コンピュータ利用の多いときと少ないときの山谷を均してくれ、コストダウンできる。季節変動の多い企業だとピーク時にAT&Tのクラウドコンピューティングサービスを使うことができる。あるいは台風や災害によってコンピュータを交換しなければならなくなった場合、コンピュータのアセットを動かさなくてもネットワークを変更するだけですむ。さらにソフトウェアやハードウェアをアップグレードする場合でもセキュリティをいじらなくてもすむ。

AT&T Labsには1300名の研究者と700名の非研究者が米国内で働いている。ニュージャージー州とテキサス州、カリフォルニア州に研究所を持つが、今のところ海外には研究拠点はない。研究者の75%が博士号を取得しており、ノーベル賞受賞も7件ある。