ロゼッタのAI翻訳データセンターの裏側 - NVIDIA AI Days 2022 Spring

5000社を超す企業が活用しているロゼッタの自動翻訳

AI翻訳のデータセンターを運営するロゼッタ社が、NVIDIA AI Days 2022 Springにおいて同社のデータセンターの裏側を説明する発表を行った。少し長いのであるが、このような内幕の発表は稀であり、興味深いので詳しく紹介して行きたい。

なお、ロゼッタ社と、ソースネクスト社が販売する語学学習プログラムのロゼッタストーンとは名前は似ているが、無関係である。

ロゼッタ社は高性能のAI自動翻訳の開発、サービス提供、運営を行う会社で、5000社以上の会社にAI翻訳サービスを提供している。一般的なAI翻訳はポケットに入るデバイスが発売されたりしているが、業務に使おうとすると、なかなかうまく行かない。一般の会話ではあまり使われないが、ある仕事の範囲では良く出てくる単語や言い回しに対応した翻訳ができないと、そこでつかえてしまって効率が上がらず使い物にならないということが良く起こる。そのような場合、契約した会社のAI翻訳の辞書などをカスタマイズしてちゃんと翻訳できるようにしてくれれば、使い勝手は大幅に改善する。これは一例であるが、自社の使い方に合わせてカスタマイズして使い勝手を改善するというニーズは多いと思われる。

ロゼッタ社は2000年に翻訳会社としてスタートし、2006年にAI自動翻訳サービスを開始した。2017年にはプロ翻訳者レベルに自動翻訳の精度が向上した。現在は同社の自動翻訳を導入した企業が5000社を超えている。

ロゼッタ社の沿革。2000年に翻訳会社としてスタート。2066年にAI自動翻訳のサービスを開始。2021年には導入企業が5000社を突破 (出典:NVIDIA AI Days Spring 2022におけるロゼッタ社の木村浩康CSOの発表資料のコピー、以下すべて同様)

2004年より始まったロゼッタの自動翻訳開発の歴史

ロゼッタ社は2004年に創立され、2006年には専門用語に強い自動翻訳を行う「塾考」をリリースした。

2006年には専門用語に強い自動翻訳を実現。2015年には2015分野に訳し分け、2017年には自動翻訳のカスタマイズを行って、最大精度95％を実現

なお、この発表ではほとんど触れられなかったが、ロゼッタ社は文書翻訳以外に音声翻訳やウェアラブル翻訳も行っている。ウェアラブル翻訳はMEDICAREとCONSTRUCTIONという名前がついており、その業界に特化した製品のようである。

ロゼッタが提供するAI翻訳ソリューション各種

次の図は売り上げの推移をプロットした図であるが、翻訳精度を改善した「T-400 (てぃーふぉーおーおー)」のVer2のリリースを開始したころから月間売上が急増している。また、この頃からGPUの利用を始め性能が向上したことも売り上げ急増に貢献していると思われる。

2018年に入り翻訳精度を改善したT-400 Ver2をリリース。また、この頃からGPUを利用したサービスを開始している

次の図は導入企業の分野別の数を示すグラフであるが、医薬、化学、食品分野では日経225に選ばれている企業の83％がロゼッタの自動翻訳を導入している。また、鉄鋼、金属、非金属、繊維分野の企業では61％、電気、機械、精密機器分野では57％の企業がロゼッタの自動翻訳を使っているという。

日経225に選ばれている医薬、化学、食品企業の内の83％はロゼッタの自動翻訳の使用実績があるという。鉄鋼などの分野の企業では61％、電気などの分野の企業では、この割合は57％とやや低い比率になっているがそれでも約60％の日経225企業が使っている

今回の発表で伝えたいことは、ディープラーニングを活用したサービスの展開には何が必要か、なぜロゼッタ社はオンプレミス(自社設置サーバ)を選んだかを説明したかったからであるという。

ディープラーニングを使うサービスの提供には何が必要かと、なぜロゼッタはオンプレミスを選んだかを説明

莫大なコストが必要なAI開発

ディープラーニングにはGPUを搭載したサーバさえあれば良いと思っている人があるが、それは間違いで、ニューラルネットワークの種類、使用するフレームワークのアーキテクチャとサーバのアーキテクチャの相性によって大きな違いが出るので、注意深く選択することが大事である。

白鳥が優雅に泳いでいる話(ディープラーニングでうまく行った)はあちこちの講演でたくさん聞けるが、今回の発表では、研究レベルの話ではなくサービスとして展開する時の知見の一部(苦労話)が紹介された

前の白鳥の図のところで述べたように、研究フェーズとサービスフェーズには大きなギャップがある。研究として立派な成果が出てきているものの内、実際にサービスとして提供できているものはどのくらい有るのか、という点はよく議論されている部分である。

次に述べるように、AIの開発には資金が必要であり、よく考えていないとその資金があっという間に溶けてしまうとのことである。

何も考えないと……資金があっという間に溶けていってしまうこととなるのがAI開発である

ディープラーニングには通常GPUが使われるが、GPUボード1枚でもかなりのコストが必要となる。そして、高性能のGPUボードは200Wとか300Wの消費電力で、その電気代も馬鹿にならないうえに、GPUサーバを設置するデータセンターの空調費や場所代も必要となってくる。

そもそもディープラーニングではパラメータのチューニングのために多数の入力パターンを学習する必要があるので、AIサーバのリソースはいくらでも必要という状況となり、資金が必要となってくる。

最近では人工知能モデルのサイズが急増し、OpenAIのGPT-3モデルを1回チューニングするためには100万ドル(約1.4億円)掛かると言われている。また、最近の物価上昇傾向、為替変動、ウクライナへのロシア侵攻、コロナ禍による半導体調達難といった状況が、さらにコストを高めているとされている。

なぜAI開発にコストがかかるのか

ロゼッタのAI翻訳データセンターの裏側 - NVIDIA AI Days 2022 Spring

目次

5000社を超す企業が活用しているロゼッタの自動翻訳

2004年より始まったロゼッタの自動翻訳開発の歴史

莫大なコストが必要なAI開発

AIが勧める、あなたのための会員限定記事

Microsoft 365 Officeのアクティベート、ランダムに無効になる不具合

軍事とIT 第589回システムの統合化(23)米海軍に見る複合戦指揮官コンセプトと指揮統制システム

三井住友信託銀、システム内製化に向け三井住友トラスト S&S統合

サイフューズとSCREEN、細胞製品の品質評価を効率化する新技術を開発

筑波大と三井不動産、次世代サイエンスパーク実現に向け産学連携協定を締結

Samsungが半導体事業の本拠地を平澤に移転か？　韓国メディア報道

編集部が選ぶ関連記事

NVIDIAのOmniverseが実現するデジタルツインによる時空を超えた連携

NVIDIAが量子・古典コンピューティングを加速する「QODA」プラットフォームを発表

NVIDIAとサイバーエージェント、デジタルヒューマン開発事業で協業

NVIDIAがGraceとHopperという名のスーパーチップとEOSスパコンを発表

関連リンク

JAIST、「並行量子通信プロトコル」の完全な自動形式検証を実現

ニデックのAIサーバ向けオープン水冷式CDU、累計出荷台数5000台を突破

AI活用の鍵を握る電力性能比の向上に注力するAMD - AMD Advancing AI ＆ HPC 2024 Japan

産総研など、シリコン型量子ビットの特性が長周期で変化する原因を特定

気象庁が新たにスパコンを調達、新システムを運用開始――激甚化する自然災害から国民の生命・財産を守るために、インテル® Xeon® CPU マックスシリーズを採用

富士フイルムなど、材料開発の期間短縮が見込める量子コンピュータ向けワークフロー

このカテゴリーについて

ロゼッタのAI翻訳データセンターの裏側 - NVIDIA AI Days 2022 Spring

目次

5000社を超す企業が活用しているロゼッタの自動翻訳

2004年より始まったロゼッタの自動翻訳開発の歴史

莫大なコストが必要なAI開発

AIが勧める、あなたのための会員限定記事

Microsoft 365 Officeのアクティベート、ランダムに無効になる不具合

軍事とIT 第589回 システムの統合化(23)米海軍に見る複合戦指揮官コンセプトと指揮統制システム

三井住友信託銀、システム内製化に向け三井住友トラスト S&S統合

サイフューズとSCREEN、細胞製品の品質評価を効率化する新技術を開発

筑波大と三井不動産、次世代サイエンスパーク実現に向け産学連携協定を締結

Samsungが半導体事業の本拠地を平澤に移転か？ 韓国メディア報道

編集部が選ぶ関連記事

NVIDIAのOmniverseが実現するデジタルツインによる時空を超えた連携

NVIDIAが量子・古典コンピューティングを加速する「QODA」プラットフォームを発表

NVIDIAとサイバーエージェント、デジタルヒューマン開発事業で協業

NVIDIAがGraceとHopperという名のスーパーチップとEOSスパコンを発表

関連リンク

JAIST、「並行量子通信プロトコル」の完全な自動形式検証を実現

ニデックのAIサーバ向けオープン水冷式CDU、累計出荷台数5000台を突破

AI活用の鍵を握る電力性能比の向上に注力するAMD - AMD Advancing AI ＆ HPC 2024 Japan

産総研など、シリコン型量子ビットの特性が長周期で変化する原因を特定

気象庁が新たにスパコンを調達、新システムを運用開始――激甚化する自然災害から国民の生命・財産を守るために、インテル® Xeon® CPU マックス シリーズを採用

富士フイルムなど、材料開発の期間短縮が見込める量子コンピュータ向けワークフロー

このカテゴリーについて

軍事とIT 第589回システムの統合化(23)米海軍に見る複合戦指揮官コンセプトと指揮統制システム

Samsungが半導体事業の本拠地を平澤に移転か？　韓国メディア報道

気象庁が新たにスパコンを調達、新システムを運用開始――激甚化する自然災害から国民の生命・財産を守るために、インテル® Xeon® CPU マックスシリーズを採用