米IBMは10月21日(現地時間)、年次イベント「TechXchange」で独自のAI基盤モデル「Granite 3.0」のリリースを発表した。GraniteはIBMのフラッグシップの言語モデルとなる。
「Granite 3.0」の概要
GraniteモデルはApache 2.0ライセンスのもとでリリースし、一般/言語に「Granite 3.0 2B Instruct」「同8B Base」「同2B Base」。ガードレールと安全性では「Granite Guardian 3.0 8B」「同3.0 2B」、混合エキスパートでは「Granite 3.0 3B-A800M Instruct」「同1B-A400M Instruct」「同3B-A800M Base」「同1B-A400M Base」となる。
Granite 3.0 8Bおよび2B言語モデルは、エンタープライズAI向けの主力モデルとして設計されており、検索拡張生成(RAG)、分類、要約、エンティティ抽出、ツール使用などのタスクでパフォーマンスを発揮。企業データで微調整し、多様なビジネス環境やワークフローにシームレスに統合できるように設計されている。
Granite 3.0言語モデルは、Hugging FaceのOpenLLM Leaderboardで定義された標準的な学術ベンチマークにおいて、Granite 3.0 8B Instructモデルの全体的な平均性能は、MetaやMistralの同規模の最先端のオープンソース・モデルを上回っている。AttaQ安全性ベンチマークでは、Granite 3.0 8B Instructモデルは、MetaやMistralのモデルと比較して、測定した安全性のすべての基準で上回っているという。
RAG、ツールの使用、およびサイバーセキュリティ領域のタスクの中核となる企業タスクの全体にわたって、Granite 3.0 8B Instructモデルは、MistralやMetaの同規模のオープンソース・モデルと比較して、平均してトップクラスのパフォーマンスを示している。
日本語を含む12種類の自然言語と116種類のプログラミング言語から収集された12兆トークンのデータを利用して、データ品質、データ選択、学習パラメーターを最適化するために設計された数千の実験結果を活用した新しい2段階学習法を用いて学習。2024年末までに、Granite 3.0 8Bと2B言語モデルは、拡張された128Kのコンテキスト長とマルチモーダル文書理解機能をサポートを予定。
また、今年初めに最初のバージョンがリリースされた、事前学習済みのGranite時系列モデルの更新版のリリースを発表。これらの新モデルは、3倍以上のデータで学習され、3つの主要な時系列ベンチマークすべてにおいて、GoogleやAlibabaなどが提供する10倍以上のサイズのモデルを上回る性能を発揮するという。
同社は今回のリリースの一環として、アプリケーション開発者がユーザーのプロンプトや大規模言語モデル(LLM)の応答を、さまざまなリスクの観点から確認することで安全対策を導入できるGranite Guardianの新シリーズも発表。
Granite Guardian 8Bおよび2Bモデルは、現在市場で入手可能なリスクおよび有害性検出機能の中で包括的なセットを提供する。社会的偏見、憎悪、攻撃性、冒涜、暴力、ジェイル・ブレイキングなどの有害性に加え、これらのモデルは根拠、文脈の関連性、回答の関連性といったRAG特有のチェックも提供。
Granite Guardian 3.0 8Bモデルは、MetaのLlama Guardモデルの3世代よりも、有害性検出において全体的に高い平均精度を示したとのこと。また、ハルシネーション検出においても、このタスクに特化したモデルであるWeCheckやMiniCheckと比較して、平均して同等の総合的な性能を示し、Granite Guardianモデルは、対応するGraniteの言語モデルから派生したものですが、オープンまたは専有のAIモデルと併用してガードレールを実装するために利用することもできるという。
提供形態については、すべてのGranite 3.0モデルと更新版の時系列モデルは、Hugging Face上でApache 2.0ライセンスのもとでダウンロードが可能。Granite 3.0 8Bと2B言語モデル、Granite Guardian 3.0 8Bおよび2Bモデルの指示追従モデルは、IBMのwatsonxプラットフォーム上で商用利用を可能としている。
さらに、Graniteコード・モデルを搭載し、C、C++、Go、Java、Pythonなどの言語に対する汎用的なコーディング支援やエンタープライズJavaのアプリケーションモダナイゼーション機能を提供するwatsonx Code Assistantの次期リリースも発表。これにより、Graniteのコード機能は、Visual Studio Codeの拡張機能であるIBM Granite.Codeからもアクセスできるようになった。
また、watsonx.aiを通じて開発者がAIを効率的に構築、カスタマイズ、展開できるように、エージェントフレームワーク、既存環境との統合、RAGやエージェントなどの一般的なユースケースのためのローコード自動化などの新しいツールのリリースを予定。
加えて、IBM watsonx Orchestrateに新しいAIエージェントチャット機能の導入を予定。同機能は、エージェント機能を使用してAIアシスタントやスキル、自動化をオーケストレーションし、ユーザーがチーム全体の生産性を向上できるように支援。2025年に特定のドメインやユースケース向けの事前構築エージェントなどの機能拡張を予定する。