Googleの日本法人は12月7日、ブログの中でマルチモーダルに対応可能な新たなAIモデル「Gemini」について紹介した。最初のモデルであるGemini 1.0は、Ultra、Pro、Nanoの3サイズで展開し、データセンターからモバイルデバイスまでさまざまな環境に最適化して動作するという。

Geminiは今後Google Bardにも搭載されるとのことだ。英語版のみではあるが、すでにBard向けに調整された Gemini Proの適用を開始している。また、来年初めをめどにGemini Ultraで動作するアドバンスモデルのBard Advancedを公開する。

12月13日からは、Google AI StudioまたはVertex AIのGemini APIを介して、開発者はGemini Proにアクセスできるようになる予定だ。Google AI Studioとは、APIキーを使用してアプリのプロトタイプを迅速に作成するための無料のWebベースの開発者ツール。

フルマネージドAIプラットフォームが必要な場合は、Vertex AIを使用してGeminiをカスタマイズし、企業のセキュリティや安全性、プライバシー、データガバナンスとコンプライアンスのための追加のGoogle Cloud機能を利用できるようだ。

  • GoogleがGeminiを発表した

    GoogleがGeminiを発表した

Geminiはマルチモーダルに対応するよう開発され、テキスト、画像、音声、動画、コードなど複数の情報を一般化してシームレスに組み合わせながら処理可能。特にGemini Ultraは、数学、物理学、歴史、法律、医学、倫理など57科目の組み合わせで知識と問題解決能力をテストするMMLU(Massive Multitask Language Understanding:大規模マルチタスク言語理解)で90.00%を記録した。

  • 主要なベンチマークのスコア
  • 主要なベンチマークのスコア

    主要なベンチマークのスコア

また、GeminiはPythonやJava、C++、Goなどさまざまなプログラミング言語にも対応可能だ。コードの理解や説明、生成が可能だという。同社は複数の言語を超えて機能し複雑な情報を推論できる、先進的なコーディング基盤モデルだとしている。

同社がカスタマイズしたGeminiを使用して開発したAlphaCode2は、前モデルであるAlphaCodeと比較して約2倍の問題解決性能を有するそうだ。さらに、AlphaCodeがコンテスト参加者の50%よりも優れたパフォーマンスを示したプラットフォームにおいて、それを上回る85%の記録を残した。プログラマがAlphaCode2に従うコードサンプルの特定プロパティを定義すると、パフォーマンスがさらに向上するという。

同社はGemini Nanoを搭載したスマートフォン、Google Pixel 8 Proについても発表した。Gemini Nanoはレコーダーアプリの要約機能を強化するだけでなく、WhatsAppをはじめとするGboardのスマートリプライにも展開され、今後さらに多くのメッセージングアプリに対応する予定。Geminiは今後、Google検索、広告、Chrome、Duet AIなど主要なサービスで利用できるようになるとのことだ。

  • Googleデータセンタに並ぶCloud TPU v5p AIアクセラレータスーパーコンピュータ

    Googleデータセンタに並ぶCloud TPU v5p AIアクセラレータスーパーコンピュータ