ソフトバンク、国産LLMの開発を本格始動‐2024年内に3500億パラメーターへ

ソフトバンクは10月31日、日本語に特化した国産の大規模言語モデル（LLM）の開発を本格的に開始すると発表した。生成AI（人工知能）開発向けの計算基盤の稼働を開始し、子会社のSB Intuitionsがこの計算基盤を活用して開発を進める。今後、2024年内に3500億パラメーターの国産LLMの構築を目指す。

米エヌビディアのAIスパコンなどをベースとした生成AI計算基盤の設備

ソフトバンクは5月に生成AI開発向けの計算基盤を構築すると発表した。総額200億円を投じてGPUクラウドサービスを24年3月までに構築する。同計算基盤は7月に経済産業省から、経済安全保障推進法に基づく特定重要物資である「クラウドプログラム」の供給確保計画について認定を受け、助成金53億円を受けることになっている。

同計算基盤は米エヌビディアの「NVIDIA Tensor コア GPU」を2000基以上搭載したAIスーパーコンピューター「NVIDIA DGX SuperPOD」や「NVIDIA ネットワーキング」、「NVIDIA AI Enterpriseソフトウエア」で構成されており、ソフトバンクによると、LLMの学習向けの計算基盤において国内最大級だという。

この計算基盤は、まずソフトバンクとSB Intuitionsで段階的に利用しながら、2023年度中にすべての投資と構築を完了させ、早期に大学や研究機関、企業などに提供する予定だ。今後、日本語のデータセットを活用した高品質な国産LLMを開発することで、日本の商習慣や文化に適した生成AIサービスの提供を実現していく考え。

ソフトバンク代表取締役社長執行役員兼 CEOの宮川潤一氏は「現在、計算基盤やLLMへの大規模投資は海外企業を中心に行われており、他言語のデータセットを基にした生成AI開発が先行している。日本の文化やビジネスの慣習などに最適な国産LLMを開発することで、あらゆる産業への生成AIソリューションの導入を支援し、デジタルの社会実装の実現を目指していく」とコメントしている。