インターネットの半分以上は英語

Q-Successの調査によれば、2024年1月におけるWebサイトコンテンツの記述に使われている自然言語の割合は次のようになっている(参考「Usage Statistics and Market Share of Content Languages for Websites, January 2024」)。

順位 自然言語 割合
1 英語 51.7%
2 スペイン語 5.6%
3 ドイツ語 4.8%
4 ロシア語 4.5%
5 日本語 4.4%
6 フランス語 4.3%
7 ポルトガル語 3.2%
8 イタリア語 2.4%
9 トルコ語 2.0%
10 オランダ語、フラマン語 1.8%

英語が51.7%と、圧倒的に多い。これにスペイン語、ドイツ語、ロシア語が続いており、日本語の占める割合割合は4.4%で第5位だ。つまり、インターネットにおける日本語の情報は全体から見ると少ない。

Webブラウザの翻訳機能が便利

日本語を母国語とするユーザーの多くが英語を苦手としている。しかしながら、最近は技術がこれを補助してくれる。

日本においてPCで使われているWebブラウザはGoogle Chromeが65.54%で最も多く、これにMicrosoft Edgeが19.89%で続いている(参考「Desktop Browser Market Share Japan | Statcounter Global Stats」)。すなわち、Google ChromeとMicrosoft Edgeで85%以上を占めているのだが、これらWebブラウザはWebページの翻訳機能を提供している。

例えば、「Deceptive Cracked Software Spreads Lumma Variant on YouTube | FortiGuard Labs」を見てみよう。英語で記述されたWebページだ。

  • Deceptive Cracked Software Spreads Lumma Variant on YouTube|FortiGuard Labs

    Deceptive Cracked Software Spreads Lumma Variant on YouTube | FortiGuard Labs

Microsoft EdgeやGoogle Chromeでは表示したWebページをそのまま日本語に翻訳して表示させることができる。

  • 日本語に翻訳した状態 - Microsoft Edge

    日本語に翻訳した状態 - Microsoft Edge

  • 日本語に翻訳した状態 - Google Chrome

    日本語に翻訳した状態 - Google Chrome

Microsoft Edgeの翻訳とGoogle Chromeの翻訳は機械翻訳だ。時に不自然な翻訳をすることもあるが、全体の意味を把握するには十分なクオリティといえる。EdgeとChromeの翻訳エンジンは異なるので、Edgeで翻訳が不自然だったらChromeで翻訳して読むことで補完するといった使い方もできる。

EdgeやChromeの翻訳機能がもたらすメリットは大きい。英語が読めない人もこの機能を使うことで、英語やそれ以外の言語のWebページを読めるようになる。

翻訳できないWebページに困惑

しかし、中にはEdgeやChromeの翻訳機能が使えないWebページがある。例えば、「APT Threat Landscape in APAC 2023: New Strategy, New Normal, New Techniques, and New Territory - TeamT5」を見てみよう。

  • APT Threat Landscape in APAC 2023: New Strategy、New Normal、New Techniques、and New Territory - TeamT5

    APT Threat Landscape in APAC 2023: New Strategy, New Normal, New Techniques, and New Territory - TeamT5

このWebページをMicrosoft Edgeの翻訳機能で翻訳すると次のようになる。

  • Microsoft Edgeで翻訳 - 翻訳されない

    Microsoft Edgeで翻訳 - 翻訳されない

Microsoft Edgeは翻訳したと報告しているが、Webページは英語のままだ。

ボットなどに悪用されることを防止するためにこうした仕組みにしていたり、デザイン上の仕組みが結果としてこうした挙動を招いていたり、原因はさまざまだ。しかし、ユーザーからすれば翻訳して内容を読みたいだけなので、翻訳できないと困ってしまう。

テキストを手動でコピペして翻訳することもできるが

翻訳できないWebページの内容を翻訳して読む方法はいくつかある。最も簡単だと思われるのは、Webブラウザからテキストをコピー&ペーストして、タイトルや改行などを整理し、翻訳サービスにかけるという方法だ。

この方法は確実ではあるが、テキストの編集に手間がかかるし、無償のサービスを使う場合は1度に翻訳できるテキスト量に上限があることが多いため、回数を分けて翻訳することになる。当然、Webページのレイアウト情報は入っていないので、もとのWebページの内容を同時に見ながら翻訳されたテキストを読むことになる。不可能ではないが便利とはいえない。