5000社を超す企業が活用しているロゼッタの自動翻訳

AI翻訳のデータセンターを運営するロゼッタ社が、NVIDIA AI Days 2022 Springにおいて同社のデータセンターの裏側を説明する発表を行った。少し長いのであるが、このような内幕の発表は稀であり、興味深いので詳しく紹介して行きたい。

なお、ロゼッタ社と、ソースネクスト社が販売する語学学習プログラムのロゼッタストーンとは名前は似ているが、無関係である。

ロゼッタ社は高性能のAI自動翻訳の開発、サービス提供、運営を行う会社で、5000社以上の会社にAI翻訳サービスを提供している。一般的なAI翻訳はポケットに入るデバイスが発売されたりしているが、業務に使おうとすると、なかなかうまく行かない。一般の会話ではあまり使われないが、ある仕事の範囲では良く出てくる単語や言い回しに対応した翻訳ができないと、そこでつかえてしまって効率が上がらず使い物にならないということが良く起こる。そのような場合、契約した会社のAI翻訳の辞書などをカスタマイズしてちゃんと翻訳できるようにしてくれれば、使い勝手は大幅に改善する。これは一例であるが、自社の使い方に合わせてカスタマイズして使い勝手を改善するというニーズは多いと思われる。

ロゼッタ社は2000年に翻訳会社としてスタートし、2006年にAI自動翻訳サービスを開始した。2017年にはプロ翻訳者レベルに自動翻訳の精度が向上した。現在は同社の自動翻訳を導入した企業が5000社を超えている。

  • ロゼッタ社の沿革

    ロゼッタ社の沿革。2000年に翻訳会社としてスタート。2066年にAI自動翻訳のサービスを開始。2021年には導入企業が5000社を突破 (出典:NVIDIA AI Days Spring 2022におけるロゼッタ社の木村浩康CSOの発表資料のコピー、以下すべて同様)

2004年より始まったロゼッタの自動翻訳開発の歴史

ロゼッタ社は2004年に創立され、2006年には専門用語に強い自動翻訳を行う「塾考」をリリースした。

  • 2006年には専門用語に強い自動翻訳を実現

    2006年には専門用語に強い自動翻訳を実現。2015年には2015分野に訳し分け、2017年には自動翻訳のカスタマイズを行って、最大精度95%を実現

なお、この発表ではほとんど触れられなかったが、ロゼッタ社は文書翻訳以外に音声翻訳やウェアラブル翻訳も行っている。ウェアラブル翻訳はMEDICAREとCONSTRUCTIONという名前がついており、その業界に特化した製品のようである。

  • ロゼッタが提供するAI翻訳ソリューション各種

    ロゼッタが提供するAI翻訳ソリューション各種

次の図は売り上げの推移をプロットした図であるが、翻訳精度を改善した「T-400 (てぃーふぉーおーおー)」のVer2のリリースを開始したころから月間売上が急増している。また、この頃からGPUの利用を始め性能が向上したことも売り上げ急増に貢献していると思われる。

  • 2018年に入り翻訳精度を改善したT-400 Ver2をリリース

    2018年に入り翻訳精度を改善したT-400 Ver2をリリース。また、この頃からGPUを利用したサービスを開始している

次の図は導入企業の分野別の数を示すグラフであるが、医薬、化学、食品分野では日経225に選ばれている企業の83%がロゼッタの自動翻訳を導入している。また、鉄鋼、金属、非金属、繊維分野の企業では61%、電気、機械、精密機器分野では57%の企業がロゼッタの自動翻訳を使っているという。

  • 日経225に選ばれている医薬、化学、食品企業の内の83%はロゼッタの自動翻訳の使用実績があるという

    日経225に選ばれている医薬、化学、食品企業の内の83%はロゼッタの自動翻訳の使用実績があるという。鉄鋼などの分野の企業では61%、電気などの分野の企業では、この割合は57%とやや低い比率になっているがそれでも約60%の日経225企業が使っている

今回の発表で伝えたいことは、ディープラーニングを活用したサービスの展開には何が必要か、なぜロゼッタ社はオンプレミス(自社設置サーバ)を選んだかを説明したかったからであるという。

  • ディープラーニングを使うサービスの提供には何が必要か

    ディープラーニングを使うサービスの提供には何が必要かと、なぜロゼッタはオンプレミスを選んだかを説明

莫大なコストが必要なAI開発

ディープラーニングにはGPUを搭載したサーバさえあれば良いと思っている人があるが、それは間違いで、ニューラルネットワークの種類、使用するフレームワークのアーキテクチャとサーバのアーキテクチャの相性によって大きな違いが出るので、注意深く選択することが大事である。

  • 今回の発表では、研究レベルの話ではなくサービスとして展開する時の知見の一部(苦労話)を紹介

    白鳥が優雅に泳いでいる話(ディープラーニングでうまく行った)はあちこちの講演でたくさん聞けるが、今回の発表では、研究レベルの話ではなくサービスとして展開する時の知見の一部(苦労話)が紹介された

前の白鳥の図のところで述べたように、研究フェーズとサービスフェーズには大きなギャップがある。研究として立派な成果が出てきているものの内、実際にサービスとして提供できているものはどのくらい有るのか、という点はよく議論されている部分である。

次に述べるように、AIの開発には資金が必要であり、よく考えていないとその資金があっという間に溶けてしまうとのことである。

  • 資金があっという間に溶けていってしまうこととなるのがAI開発

    何も考えないと……資金があっという間に溶けていってしまうこととなるのがAI開発である

ディープラーニングには通常GPUが使われるが、GPUボード1枚でもかなりのコストが必要となる。そして、高性能のGPUボードは200Wとか300Wの消費電力で、その電気代も馬鹿にならないうえに、GPUサーバを設置するデータセンターの空調費や場所代も必要となってくる。

そもそもディープラーニングではパラメータのチューニングのために多数の入力パターンを学習する必要があるので、AIサーバのリソースはいくらでも必要という状況となり、資金が必要となってくる。

最近では人工知能モデルのサイズが急増し、OpenAIのGPT-3モデルを1回チューニングするためには100万ドル(約1.4億円)掛かると言われている。また、最近の物価上昇傾向、為替変動、ウクライナへのロシア侵攻、コロナ禍による半導体調達難といった状況が、さらにコストを高めているとされている。

  • なぜAI開発にコストがかかるのか

    なぜAI開発にコストがかかるのか