アマゾン ウェブ サービス(AWS) ジャパンはこのほど、マシンラーニングにフォーカスしたイベント「AWS Solution Days 2017 ~AI & Machine Learning Day~」を開催した。同イベントでは、AI関連サービスの最新情報、AWS上でAI・マシンラーニング技術を活用しているユーザーの事例が紹介された。

AIの「推論」に当たる機能を提供するAWSのサービス群

アマゾン ウェブ サービス ジャパン 技術本部 ソリューションアーキテクト 志村誠氏

初めに、アマゾン ウェブ サービス ジャパン 技術本部 ソリューションアーキテクトの志村誠氏が、同社のAI関連サービスについて説明した。

志村氏は、AWSが20年間にわたりAIへの投資を行っており、Amazonに対してAI技術を提供してきたと語った。例えば、検索時のキーワード補完、物流センターの配送プロセス、スマートスピーカー「Amazon Echo」などに、AWSのAI技術が導入されている。

志村氏は、AI活用の流れについて「データをもとに学習を行い、そこから推論する。データに基づく学習は繰り返し行う」と説明し、それぞれのステップに対し、同社はサービスを提供している。AWSのAIサービスは「インフラストラクチャ」「エンジン」「プラットフォーム」「サービス」の4レイヤーから構成される。

  • AI活用の流れ

  • 4つの流れから構成されるAWSのAIサービス群

推論に当たる機能を提供する主なサービスは「Amazon Polly」「Amazon Rekognition」「Amazon Lex」だ。AWSが提供する深層学習モデルをAPIで簡単に利用できる。AWSのAIサービスと言われて、頭に浮かぶのはこの3つのサービスだろう。

Amazon Polly

Amazon PollyはAIを活用して、テキストをリアルな音声に変換するサービスで、24の言語で、50のリアルな声優の音声を提供する。

志村氏は、同サービスの特徴について「低レイテンシーであるうえ、0.0X秒で回答できるため、リアルタイムで処理が必要なシステムを構築する際の選択肢となりうる。また、SSMLが使えるため、発音、ボリューム、速度を調整することができる」と説明した。

今年11月には、東京リージョンで男性「Takumi」の声が利用できるようになったほか、大きな人の声と小さな人の声を出すことができるようになったという。

Amazon Rekognition

Amazon Rekognitionは、深層学習に基づく画像認識サービスだ。「物体とシーンの検出」「顔分析」「顔照合」「顔認識」の機能をAPIとして提供するので、これらの機能をアプリケーションに容易に追加できる。志村氏によると、今のところよく使われる機能は顔分析とのことだ。

志村氏は、新しい機能として、有名人を認識する機能と成人向けコンテンツをけんしゅつする機能を紹介した。イメージモデルを用いることで、コンテンツがわいせつか、暴力的かどうかなどをフィルタリングすることが可能だという。

Amazon Lex

Amazon Lexは、音声やテキストを用いて、アプリケーションに対話型インタフェース、いわゆる「ボット」を作成するサービスだ。AWSプラットフォームのセキュリティ、モニタリング、ユーザー認証、ビジネスロジック、ストレージ、モバイルアプリケーション開発を実現するためのスイートだ。

プラットフォームから下の3つのレイヤーから提供するサービスは、自社でデータ分析モデルを構築する企業向けとなる。例えば、「プラットフォーム」レイヤーには、フルマネージドの予測モデルとAPIを提供する「Amazon Machine Learning」がある。同サービスでは、線形回帰、2項ロジスティック回帰、多項ロジスティック回帰の3種類のアルゴリズムをサポートする。