お知らせ: 酷似サイトにご注意ください

rinna、Llama 3に日本語継続事前学習を行った「Llama 3 Youko 8B」公開

掲載日 2024/05/07 14:16

著者：熊谷知泰

rinnaは5月7日、80憶パラメータを持つ「Llama 3 8B」に対して日本語データで継続事前学習を行った「Llama 3 Youko 8B」を開発し、Meta Llama 3 Community Licenseで公開したことを発表した。ちなみに、モデル名の由来は妖怪の「妖狐（ようこ）」とのことだ。

Llama 3 Youko 8Bの特徴

Llama 3 Youko 8Bは80億パラメータのLlama 3 8Bに対して、日本語と英語の学習データ220億トークンを用いて継続事前学習したモデル（Built with Meta Llama 3）。Meta Llama 3 Community Licenseを継承してモデルを公開しているため、ライセンスに従い利用可能。

同モデルは日本語言語モデルの性能を評価するためのベンチマークの一つである「Stability-AI/lm-evaluation-harness」の9タスクにおいて、平均スコアが66.15だったという。一方Llama 3は59.82だった。

日本語言語モデルベンチマークStability-AI/lm-evaluation-harnessのスコア

利用時にはファインチューニングやモデルマージなどを

今回公開したLlama 3 Youko 8Bは汎用的なベースモデルであることから、同社は目的とするタスクで利用する場合にはファインチューニングやモデルマージを行い利用することを勧めている。

新規無料会員登録はこちらから

ログイン／無料会員登録

会員サービスの詳細はこちら

AIが勧める、あなたのための会員限定記事

アクセスランキング

ランキングをもっと見る

もっと見る

編集部が選ぶ関連記事

関連リンク

※本記事は掲載時点の情報であり、最新のものとは異なる場合があります。予めご了承ください。

新着記事

こちらも注目

このカテゴリーについて

開発/エンジニアシステムやソフトウェアの開発に携わるエンジニアに向けた最新情報など仕事に役立つ話題などを提供していきます。