注目が集まる日本語学習AIモデルにLINEが見出す可能性とは

いわゆる“お絵描きAI”や言語処理系のAIが大きな話題となり、今AIに注目が集まっている。そんなAIを日本語ベースで活用している例の1つが、LINEとNAVERが共同開発したハイパースケールAI「HyperCLOVA」だ。

12月13日、14日に開催された「TECHフォーラムクラウドインフラ Day 2022 Dec.　変革を支えるニューノーマルのITインフラとは」に、LINE 執行役員でAIカンパニー CEOの砂金信一郎氏が登壇。「日本語でも実用段階に入ってきた大規模モデルによる生成系AIの実力と可能性」と題し、言語モデルを中心に同社のAI技術と、その可能性について語った。

“お絵描きAI”が与えたインパクト

2022年は、“お絵描きAI”に世界が驚いた年だ。検索キーワードのように、描いてほしい絵のヒントを与えると、AIが画像を生成してくれる。このキーワードを「プロンプト」と呼び、Web上では"呪文"とも言い表されている。この盛り上がりはAI業界のみに留まらず、世間一般にも広がりを見せた。砂金氏は特にインパクトが強かったものとして「Stable Diffusion」を挙げる。

「今日お話する大規模モデルというのは『事前に学習する』というのがミソです。Stable Diffusionは学習済みのモデルを含めて、世の中に公開されました。そのおかげでいろいろなお絵描きAIが世界中で量産されています」（砂金氏）

こうして「"呪文"を唱えればAIが絵を描いてくれる」という環境が作られ、日本では二次元アニメキャラのような作画に特化したお絵描きAIも誕生している。文章においても、「GPT-3」という自然言語処理モデルがムーブメントになったことがあり、生成系AIに対する期待度は高い。

そんな流れの中でLINEとNAVERが協同で研究・開発を行っているのが、2020年11月に発表されたハイパースケールAI「HyperCLOVA」だ。

「HyperCLOVAって何ですか?」

砂金氏は「『HyperCLOVAって何ですか』という問いに改めてお答えをすると、日本語ネイティブで学習をした、大規模な事前学習型モデル(pre-trained models)です」と前置きし、話を進める。

言語モデルの規模や性能を表す指標の1つにパラメータ数があるが、HyperCLOVAは今、その数が820億だという。「GPT-3」は1750億なのでその半分に満たないが、この規模で日本語を大量に学習させ、パラメータサイズを成長させたモデルは珍しい。現在は、AIデータセンター基盤「NVIDIA DGX SuperPOD」を使い、1024基の「NVIDIA A100 GPU」を軸に、Transformerをベースとする自然言語生成モデル「Megatron-LM」を用いて、言語モデル学習を進めている。

この記事は
Members+会員の方のみ御覧いただけます

ログイン／無料会員登録

会員サービスの詳細はこちら