グーグル・クラウド・ジャパンは8月1~2日、パシフィコ横浜において「Google Cloud Next Tokyo '24」を開催した。本稿では、初日に行われた基調講演の様子を紹介する。
日本市場はAIの導入で2030年までに年間49兆9000億円の経済価値が生まれる
はじめに登壇したGoogle Cloud 日本代表 平手智行氏は「ビジネスの現場でにおけるAIの活用が進み、こうした動きが加速していくことは不可避です。その中心にある生成AIは日々進化しており、生成AIの最新機能と性能をフルに発揮するためには、ふさわしいインフラも必要となります」と述べた。
現在、Google Cloudのリージョンはグローバルで広がっており、40のリージョンに拡大。リージョン間は総延長320万キロメートルを超える巨大なネットワークにより接続し、ユーザーのデータを安全かつ最小限の遅延でリージョン間を移動させているという。
平手氏は「Googleでは日本をデータのハブと位置付けており、日本と北米、アジアを結ぶ日本の海底ケーブルの開発プランを4月に発表しました。これにより、日本企業が世界のデジタル経済と高速につながることが可能になります。昨年に開設した千葉県印西市の日本発のデータセンターに続き、今後も継続的な投資を行います」と日本にコミットしていくとともに、Google CloudがAIの活用に向けてインフラの整備に取り組んでいるという姿勢を見せた。
AIについては、昨年発表されたAccess Partnershipの「Economic Impact Report」の調査では、2030年までに年間49兆9000億円の経済価値がAIの導入により、もたらされる可能性があるという。
同氏は「企業におけるAIの活用は業種特化の利用、あるいは汎用性が高く業種に関係なく利用されるケースと、2つのパータンがあります。ただ、ここで重要なことはビジネスの現場では、AIを試す段階から使う段階に確実にシフトしているということです。また、これまでのモデルの活用法に注力するフェーズから生成AIエージェントの活用へ急速にシフトしています」と最近の変化について言及した。
生成AIエージェントは、特定の目標を達成するために複数のタスクを組み合わせて行動を起こすインテリジェントな存在だという。
LLM(大規模言語モデル)単体では、メールのドラフトや会議の要約、レコメンデーションなど、業務全体のフローから切り離された特定のタスクのみを実行するにとどまっていたが、AIエージェントを通じて既存のアプリケーションと連携することで、業務全体をカバーし、業務の効率化や自動化が実現され、結果として新しい顧客体験の提供が可能になるとのことだ。
同社では理念として「大胆かつ責任あるAI」を掲げており、GeminiをはじめとしたAIを活用し、ビジネスの現場で信頼して使えるAIアプリケーションを開発・運用するためのフルスタックのサービスラインアップを揃えている。
Google DeepMindはGoogleのイノベーションカルチャーの中心
続いて、Google DeepMind プロダクト & エンジニアリング シニアディレクター セシュ・アジャラプ氏が登壇。Googleは2014年にDeepMindを買収し、2023年にGoogle内のもう1つの主要研究チームであるGoogle Brainと統合し、Google DeepMindと組織を改めた。
Google DeepMindのミッションは「人類にとって利益のあるAIを責任ある形でつくりあげる」だ。そして、昨年末に基盤モデルの「Gemini」が生み出された。現在は最新のものとして「Gemini 1.5 Pro」を提供。
アジャラプ氏は「Geminiはネイティブにマルチモーダルです。テキスト、音声、画像、動画など、さまざまなたいぷの情報をシームレスに理解し、その理由を説明することができます。最大200万トークンの情報を処理し、2時間の動画、22時間の音声に相当します。LMSYS Chatbot Arena Learderboardの日本語版で第1位です」と説明した。
そして、同氏は「われわれは大胆かつ責任あるAIのアプローチをとっています。AIが私たちを助けてくれるという興奮と緊急性を持つ大胆さ、公正や安全、倫理的、包摂的で正しいことをする責任です」と話す。
AIの可能性には注意が必要であり、例えばディープフェイクに対応するため電子透かし機能の「SynthID」はAIが生成した画像、ビデオ、テキストなどのコンテンツを識別し、誤情報に対応する重要なステップだという。
アジャラプ氏は「Google DeepMindはGoogleのイノベーションカルチャーの中心であるだけでなく、クラウドを通じてお客さまのイノベーションをサポートします」と力を込めていた。
新しい生成AI体験の開発を支援する「Vertex AI」
次に、Google Cloud AIディレクター プロダクト マネージメント アーワン・メナード氏が登場し、企業がAIから重要なビジネス価値を創出するための支援について、最新情報を紹介した。メナード氏は「われわれの戦略はビジネスユーザーと開発者のさまざまなニーズを満たす製品ポートフォリオを提供することです」と述べた。
ビジネスユーザー向けには、顧客体験や従業員の生産性向上のために導入可能な事前構築済みのAIアプリケーションとして「Gemini for Google Cloud」「同Google Workspace」「AIエージェント」、開発者向けにはAIハイパーコンピュータ、基盤モデルとしてのGemini、AI統合基盤の「Vertex AI」をそれぞれ提供している。
事前構築済みのAIアプリケーションの良い例として「Customer Experience with Google AI」を挙げた。
同氏は「AIにより強化されたフルスタックのContact center as a Serviceを備え、エンドツーエンドの顧客エンゲージメントに必要なマルチモーダル機能を提供し、例えばWebサイト上のチャットからバーチャルエージェントとの会話、人間の担当者へのシームレスな移行・サポートなどを提供します。これにより、コスト削減、顧客満足度・維持率の向上、従業員の生産性向上を実現できます」と説く。
Vertex AIは、AIエージェントを自社で構築・運用するためにエンタープライズ対応のAIプラットフォームとなり、Model Garden、Model Builder、Agent Builderで構成。
Model GardenはGeminiに加え、Anthropicの「Claude」などサードパーティのLLMも含めて150超のモデルを選択できる。最近では、大容量タスクに対応したコスト効率が高い「Gemini 1.5 Flash」、「Gemma 2」、Anthropicの最新モデル「Clude 3.5 Sonnet」を追加。また、今年後半にはGeminiにおけるユーザープロンプト、モデルの回答、教師ありデータに加え、機械学習処理など、すべての処理が日本国内で完結することもアナウンスした。
Model Builderは、チューニングや拡張、管理、監視などモデルのライフサイクル管理を容易にするという。公開プレビュー版として、Gemini 1.5 Proと同Flashを対象に、大規模なコンテンツキャッシュと新しいプロンプト入力を組み合わせ、Geminiでコンテンツ生成を可能とするコンテキストキャッシング機能を発表した。
Agent Builderは、AIエージェントを開発するため、ノーコード、ローコード、フルコードから選択してセマンティック検索やRAG(検索拡張生成)など検索、外部のデータソースを参照しながら、事実にもとづいて回答するグラウンディングを可能にするものだ。
「Grounding on Vertex AI」では、2024年第3四半期中にサードパーティのデータセットによるグラウンディング、プロンプトにもとづきRAGクエリを最適化してダイナミックにRAGを実行する機能「Dynamic Retrieval」の導入を予定し、高忠実度モードによるグランディングは試験運用プレビューとなっている。
同氏は「Vertex AIはモデルやエージェントツールの単一統合プラットフォームであり、新しい生成AI体験を開発できます。開発者やデータサイエンティストのために設計された唯一無二のソリューションなのです」と語り、降壇した。
「Gemini for Google Workspace」のアップデート
メナード氏からバトンタッチを受けて登場したのは、Google Cloud Google Workspace 事業本部 コラボレーション アプリ プロダクト マネージメント バイス プレジデント クリスティナ・ベア氏だ。
同氏によると、Gemini for Google Workspaceは2023年に提供開始して以来、100万人以上のユーザー、数万社の企業がGemini for Google Workspaceを利用しているという。
Gemini 1.5 Proは、日本語でも利用が可能で、現在は150以上の国・地域、45以上の言語に対応。
また、Google Workspace拡張機能において、日本語のβ版が提供されることを明らかにした。これによりGeminiを用いて、GmaiやGoogle ドキュメントなどの情報を参照して活用することが可能。そして、最近ローンチした「Gems」は特定用途に向けたカスタマイズができるチャットボットとなる。
また、Gmailのメール下書きやメールの要約、Google ドライブのファイル取得・要約を行う「サイドパネル」が日本語に9月から対応する。ベア氏は「GeminiはGoogle ドライブ、ドキュメント、スプレッドシート、Gmail、スライド、チャット、Meetなど、どこでも利用が可能です。毎日の業務をGoogle WorkspaceとGeminiを活用してシームレスかつ包摂的に支援します」と述べ、講演を締めくくった。