ソフトバンクはLLM(Large Language Models:大規模言語モデル)や生成AIの開発を行う子会社としてSB Intuitionsを設立し、2023年8月から本格的な稼働を開始した。
ソフトバンクがこのほど開催した法人向けイベント「SoftBank World 2024」に、SB Intuitionsの代表取締役社長 兼 CEO の丹波廣寅氏が登壇し、「なぜ日本国内で日本語に特化したモデル開発に着手するのか」や「ソフトバンクが生成AI開発の先に見ている未来像」をテーマに講演した。本稿では講演内容について紹介したい。
ソフトバンクは何を考えて国産LLMを開発しているのか?
丹波氏は、「LLMは計算基盤が大規模で、コンピューティングリソースを動かし続けなければならないのでお金がかかる。LLM単体では何をやってももうからない」と冗談交じりに話を始めた。では、なぜそれだけの投資をしながらLLM開発を進めるのだろうか。
現代の日本社会を取り巻く環境を見ると、人口は減少の一途をたどり、大量生産・大量消費からの脱却や脱炭素な生活が求められるようになっている。暮らし方や働き方にも変化が訪れ、経済活動が多様化している。
国内には地方を含めて多様な経済圏が存在するが、企業がサービスを提供する際には都市部に集中する場合が多い。丹波氏はフードデリバリーサービスを例に「都市部では自宅にいながら食べたいものを注文しすぐに届けてもらえる便利なサービスだが、地方では自分が取りに行かなければならない場合もある。わざわざ手数料を払ってお店まで商品を取りに行くのは本末転倒ではないか」と説明していた。
日本での生活スタイルや経済状況が変わりつつある中で、ソフトバンクが目指すのは「次世代デジタル社会基盤」の構築だ。都市部では便利なはずのデジタルサービスだが、地方ではサービスが機能していないのは、そのためのインフラが整っていないからであるとして、同社は全体で一貫性のあるサービス提供のための基盤として次世代デジタル社会基盤を提唱している。
「一貫性のあるサービスを構築するためには、業界をまたがってデータを連携しなければいけない。トラックの運送であれば、気象情報や交通量の情報を組み合わせることで最適なルートを割り出せる。デジタル社会化のために必要なのはAIによる予測とサジェスト機能ではないか」(丹波氏)
AIを用いた正確な予測を実行するためには、デジタルツインが重要となる。デジタルツインとは、現実世界で収集したデータを用いて、まるで双子のように仮想空間上に再現しシミュレーションする技術。
丹波氏は「デジタルツインの基盤があれば、その上に気象情報や交通量情報、自動運転の運行管理システムなどさまざまなアプリケーションが乗る。デジタルツインの原動力となるエンジンとしてAIを作りたい」と説明した。
国内での日本語LLM開発にこだわる理由
丹波氏は講演の中で「ソフトバンクはAI開発があまり得意ではない」と自虐的に話していたが、ソフトバンクのグループ内にはLINEヤフーなどで検索エンジンや生成AIの開発経験を持つエンジニアが在籍していることから、自然言語処理技術には強みを持つ。そうしたメンバーがSB Intuitionsに集まった。
ソフトバンクはAI計算基盤の構築を進めており、これまでに約185億円(クラウドプログラム補助金差引前)を投資。2024~2025年にかけてさらに1500億円を投資し、計算能力を37倍に増強するという。SB Intuitionsはこの計算基盤を利用して1兆パラメータのLLM構築を目指す。これほどの投資に対し丹波氏は「LLMだけでもうけようとは思っていない」と説明。
SB Intuitionsが開発したLLMを中核としてソフトバンクのデジタル基盤を構築し、その上にさまざまな産業をまたがるアプリケーションが乗れば、総合的には投資額以上のお金を生み出せる可能性がある、というわけだ。同氏は「仮に当社の生成AIが優秀で、1日に1つずつ画期的な新薬を生み出せるとすればLLMへの投資以上のお金が生まれるはず」と続けた。このように、ソフトバンクは多様な企業による生成AI活用を支援する方針。
では、なぜ同社は日本国内でのLLM開発を進めるのか。それは、海外のコンピュート資源に国内のデータを持ち出すリスクを危惧してのことだ。国内で保有する機微なデータや個人情報を国内にとどめ、海外に持ち出さずに処理するためだという。海外にデータ処理の拠点があれば、突然その国の法律が変わってしまうリスクなどもある。
日本語に特化したLLMの優位性とは
SB Intuitionsはこれまでに700憶パラメータの事前学習済みモデルの開発を完了し、研究開発用途として公開している。現在は商用利用向けにチューニングしている段階とのことだ。これと並行して、3900憶パラメータのモデルを年度内に構築予定だ。
同社のLLMは何と言っても、日本語に特化しスクラッチで開発している点が特長。日本語データセットを用いて学習しており、国内向けにチューニングしている。特に日本の文化や歴史、商習慣などに適した生成AIサービスを開発できる強みを持つ。
その顕著な例が2つある。例えば、「全国の地図を最初に作った人は?」と聞くと、GPT-4oは「伊能忠敬」と回答し、それに付随する情報を出力する。一方で、SB Intuitionsが開発したモデル(Sarashina)は伊能忠敬ではなく「長久保赤水」と回答した。長久保赤水は伊能忠敬およびその弟子らが測量し「大日本沿海輿地全図」を完成させるより42年前に、「改正日本輿地路程全図」を完成させたとして知られる。
また、「成人したのでたばこを吸っても良いですか」と聞くと、GPT-4oは「法律的には許可される」と回答。一方Sarashinaは「20歳未満はたばこを吸うことも、買うことも法律で禁止されています」と回答した上で2022年4月1日に成人年齢が18歳に引き下げられたことを補足した。
SB Intuitionsは今後マルチモーダルな生成AIを目指すが、ここでも日本のデータを重視する姿勢は変わらない。例えば、車のハンドルの向きが日本と海外では異なるように、日本に特化したデータを使って学習することが、より日本に適切なAIの構築につながる。
「京都の風景をAIに出力してもらったら、コンビニや飲食店の看板が茶色で描かれるほどリアルなAIにしたい」(丹波氏)
(※編集注:京都市では多くのエリアで、町並みの美観を損なうような派手な色を建物や看板に用いることを景観条例で禁止している)
さらには、生成AIの真の社会実装を見据えて、ドメイン特化のモデル開発にも注力する。各業界に応じた専門知識を持つ比較的小さなモデルを作ることで、汎用モデルでは対応が難しい特殊なタスクや業界特化の知識にも対応できるようにするとのことだ。
ドメインに特化して細分化したモデルは、業界をまたいだ活用が期待される。気象予測モデルは天気予報の他に交通ルート提案に、交通予測モデルは運行制御の他に街の信号制御に、といった具合だ。さまざまなモデルを構築した上で、それらのモデルを組み合わせて活用するユースケースを創出する。
丹波氏は「冒頭の話に戻るが、なぜ当社が生成AIにここまでお金をかけて力を入れるのか。それは、アプリケーションやユースケースのレイヤーで新しい経済活動が起きたときに、より大きな価値が生まれるはずだから。まずは、その原動力となるエンジンたる生成AIを作っているところ。日本全国の津々浦々まで一貫性のあるデジタルサービスを提供するための基盤を作りたい」と語った。
また「SB intuitionsのintuitionとは"直感"のこと。学習しないと霊感・ヤマ勘・第六感などと呼ばれてしまう。しかし適切な学習をすれば、それは経験に基づいた直感となる。当社は知性に匹敵するような直感を実現するモデルを作り、皆様と一緒に新しい社会の基盤を作りたい」と会場に訴えていた。