サイバーエージェントは5月17日、最大68億パラメータの日本語LLM(大規模言語モデル)を一般公開した。ユーザーがデータセットや事前トレーニング済みのモデル、機械学習プロジェクトのデモを共有できるプラットフォーム「Hugging Face Hub」上で一部モデルを公開

  • サイバーエージェントは5月17日、最大68億パラメータの日本語LLM(大規模言語モデル)を一般公開した

    サイバーエージェントは5月17日、最大68億パラメータの日本語LLM(大規模言語モデル)を一般公開した

公開されたモデルは、オープンな日本語データで学習したもの(WikipediaおよびCommon Crawlを使用)で、商用利用可能なCC BY-SA 4.0ライセンスで提供される。サイバーエージェントによると、5月17日現在、同モデルは日本国内における現行の公開モデルにおいて最大級の規模だという。

同モデルをベースとしてチューニングを行うことにより、対話型AIなどの開発が可能だ。日本語の自然言語処理に関する最先端の研究開発を後押しする形だ。

同社は今後、チャットボットやRPAをはじめとする業界特化型のLLMの構築や、各企業と連携したLLMを活用したビジネス開発の推進などを予定。また、LLMを活用したビジネス開発に携わるエンジニアの新規採用を実施し、体制を強化していく考えだ。