米Snowflakeは4月24日(米国時間)、オープンなエンタープライズグレードの大規模言語モデル(LLM)として独自に設計された「Snowflake Arctic」を発表した。
「Snowflake Arctic」の特徴
Arcticの特徴の一つは、費用対効果が高い点。高額なコンピューティング予算でトレーニングされたオープンソースのモデルと比較しても、SQL生成、コーディング、ベンチマークに従う命令などのタスクにおいて優れているという。
Arcticは、トレーニング効率を上げるため、独自のMixture-of-Experts(MoE)アーキテクチャを利用している。
もう一つの特徴はオープンである点だ。Arcticは制約のない個人利用、研究利用、商用利用を認めるApache 2.0ライセンスで提供される。加えて、コードテンプレートを柔軟な推論やトレーニングの選択肢と合わせて提供し、ユーザーが好きなフレームワークを利用してArcticの展開、カスタマイズを速やかに開始できるよう支援するという。
Snowflake Arctic は、Hugging Faceから入手できるほか、Snowflake Cortex、アマゾン ウェブ サービス (AWS)、Microsoft Azure、NVIDIA API カタログ、Lamini、Perplexity、Replicate、Togetter などのモデルガーデンやカタログから数日以内に入手可能。
埋め込みモデルファミリーもラインアップ
Snowflake Arcticのモデルファミリーには、Apache 2.0ライセンスに基づいてオープンソースコミュニティに公開されたテキスト埋め込みモデルファミリーのArctic embedも含まれる。
Arctic embedは現在、Hugging Faceで5モデルが提供されており、Snowflake Cortexの埋め込み機能でも近日中に提供開始予定(プライベートプレビュー中)。