「Cortana Intelligent Suite」を発表

Bot for Skypeを実現する背景には、「Cortana Intelligent Suite」が存在する。SkypeやSlackなどメジャーなテキスト/SMSサービスを統合する「Microsoft Bot Framework」と、Microsoft製Watsonとなる(かも知れない)「Cognitive Services」、既存の機械学習を組み合わせたソリューションだ。

今回Microsoftが発表した「Cortana Intelligent Suite」

Cortana Intelligent Suiteの一例としてMicrosoftは、ドミノピザへの宅配注文デモンストレーションを披露。Botで自然言語を理解するには一定のルールが必要なため、開発者はカスタマイズする必要があるものの、場面に応じて機械学習も組み込めるという。

Bot Frameworkを利用したピザの自動注文システム。ユーザーはチャットウィンドウから注文。開発者は対応する単語などを用途に合わせて調整できる

また、Cognitive Serviceのデモンストレーションとして「CaptionBot」を紹介した。こちらはアップロードした画像を解析してキャプションを付けるというサービスだが、「モナリザの微笑み」をアップロードすると「自信はないけど、鏡の前に座っているレオナルド・ダ・ビンチ本人だと思う」と回答。Cognitive Serviceは、この他にも22種類のAPIを用意している。

「CaptionBot」は日本からもアクセスできるが、対応言語は英語のみ。試しにSatya Nadella氏の画像をアップロードしてみたが、特筆するような応答はなく「屋内の人物」と回答していた

視覚障がい者を手助けするIT技術

最後は、Microsoft CEOのSatya Nadella氏による、デモンストレーションを紹介しよう。視覚障がい者が身に付けたサングラスをなぞると、サングラス内蔵のカメラがとらえた風景を分析して、目の前の状況を音声で解説する。

例えば目の前で異音が鳴った場合、撮影結果から「男性が空中にジャンプしている」「スケートボードを使っている」などと説明し、レストランではメニューの内容を音声で読み上げるというもの。現時点では製品化は予定しておらず、将来展望を映像化したものだが、実現すれば素晴らしい結果になりそうだ。

カメラを内蔵したサングラスをなぞると、目の前の状況を分析して音声で説明する

同様に会話相手の年齢や表情なども分析可能。Project Oxfordの顔認識APIを利用しているようだ

なお、今回の記事では、ライブキャストや公式ブログの映像、画像を使用している。

阿久津良和(Cactus)