Googleは27日、日本の携帯電話で使用される絵文字を符号化するユーティリティ「emoji4unicode」を公開した。ソースコードにはApache License 2.0を適用、オープンソースソフトウェアとして提供される。

同日「Google Japan Blog」宛に投稿された記事では、日本の携帯絵文字のすべてをUnicodeの文字として共通符号化しようという動きについてふれたうえで、現在使用されている絵文字のうちUnicodeで符号化されているもの / いないものを調査する作業が必要なことを指摘。調査を支援する目的で公開されたemoji4unicodeには、Googleが提案する絵文字のマッピングや変換表、絵文字データからHTMLの表などを作成する作業に有用なツールを収録しているとのこと。

絵文字は、日本の通信事業者が同一ネットワーク内での利用を前提として独自に規定したもの。キャリアにより仕様 / デザインが異なる機種依存文字であり、かつては異なるキャリアの端末宛に絵文字入りメールを送信すると、メールサーバの段階で絵文字が「〓」に変換されたり、メール全体が文字化けしたりするなどの問題が発生していた。現在では、類似したデザインの絵文字を相互に変換するフォーマット (絵文字変換表) が通信事業者間で規定されているが、国際標準化は行われていない。

Googleが絵文字の標準化に向けて動き出した (画面は絵文字をサポートした「Gmail」)