Googleは現地時間14日、開催中のGoogle I/O 2024において同社の生成AI「Gemini 1.5 Pro」のアップデートを発表した。翻訳、コーディング、推論などユースケース全体で品質向上への取り組みが行われており同日より「Gemini 1.5 Pro」に対して一連のアップデートが開始される。
2月にリリースされた「Gemini 1.5 Pro」は、応答を生成するための参照テキスト量を示すコンテキストウィンドウに100万トークンを備えるが、これを開発者向けのプライベートプレビューで200万トークンへと拡張する。Google AI StudioとGoogle Cloud向けのVertex AIでそれぞれ参加申し込みが可能になる。
また、Gemini APIには動画によるプロンプトや並列関数呼び出しを追加。6月までには低レートでキャッシュに保存したトークンを運用するコンテキストキャッシュ機能を提供するなどマルチモーダルな開発環境を促進している。
Geminiと技術基盤を共有し、Kerasや PyTorch、Colabノートブックなどの環境下で開発可能で使用条件にそって再配布も可能な"オープンモデル"に27Bモデルを加えるGemma 2、応答時間を優先する小型のGemini 1.5 Flash、画像キャプション、画像ラベル付けタスクなどに最適化するPaliGemmaなどラインナップの拡充を図っている。そのほか、詳細は公式ブログに掲載してある。