米Googleは7月25日(現地時間)、無料で利用できる対話型AI「Gemini」のAIモデルを「Gemini 1.5 Flash」にアップグレードした。これにより、レスポンスと対話の品質が全面的に向上し、特に推論と画像理解が改善された。日本語を含む40以上の言語に対応。Webとモバイルアプリの両方で、230以上の国・地域で利用できる。
Gemini 1.5 Flashは、Geminiの高性能モデル「Gemini 1.5 Pro」を用いて蒸留(Distillation)技術で開発された。Googleが5月にGoogle I/O 2024で発表し、パブリックレビューを開始した。蒸留とは、既存モデル(Gemini 1.5 Flashの場合はGemini 1.5 Pro)の出力を教師モデルとしてトレーニングする手法で、生徒モデルはより小型で推論能力が高速になり、リアルタイム処理や大規模なデータへの適用が可能となる。
Gemini 1.5 Flash導入に伴い、Geminiのコンテキスト・ウィンドウが8000トークン(Gemini 1.0 Pro)から32000トークンに拡張された。これにより、より長い会話や複雑な質問に対応できるようになった。この大きなコンテキストウィンドウを活用できるよう、Googleは近々、ファイルをGoogleドライブから、またはデバイスから直接アップロードできる機能をGeminiに追加する予定である。