ジャストシステムが毎年恒例のバージョンアップを発表し、「一太郎2018」が来年(2018年)2月9日から発売されることになった。新しい一太郎は印刷などの出力まわりの機能が強化されていて、国産日本語ワードプロセッサの定番として盤石の地位をキープできそうだ。
もちろん、日本語入力システムのATOKにも手が入った。現行のATOK2017は、AIを使ったディープラーニングによって、先代のATOK2016比で誤変換の30%削減を実現した「ATOKディープコアエンジン」を搭載していた。そのエンジンが強化され、さらに自然な日本語変換となるようにチューニングが進んだという。 また、ディープラーニングを入力支援にも適用した「ATOKディープコレクト」が新搭載される。
新ATOKは入力ミスを自動修復、適切な変換に
これまでの日本語入力システムは、ユーザーが入力した「読み」をいかに正確に漢字仮名交じりに変換するかにフォーカスしてきた。ATOKも例外ではなく、ある意味で、「かな漢字変換システム」としての進化を続けてきた。
これは、ユーザーが正しい読みを入力するという前提があってこそのシステムだ。でも、ユーザーは必ず正しい読みを入力するとは限らない。当然ミスタイプはあらゆる場面で頻発する。そのミスタイプが混じった読みを変換しようとしても、正しい日本語は入力できない。そこが日本語変換システムの域を脱することができず、日本語入力システムになれなかったATOKのジレンマでもある。人間が間違うわけがないという前提では完結しないのだ。
今回のATOKは「ユーザーは必ずしも正しい読みを入力しない」、「ユーザーは間違う」ということを前提においた。入力ミスと思われる読みを自動修復して、適切だと思われる変換をするようになったのだ。それによってATOK2017比で修復率が35%高まったという。つまり、正しい変換だけに注力するのではなく、読みを誤り訂正することで変換精度を向上させる、という方向性を模索し始めたわけだ。
"安全に動く"仕組みをAIに導入
コンピューターの世界にはフェイルセーフという考え方がある。これは、機械やシステムが必ず故障することを前提にし、たとえ、誤操作や誤動作が起こってもそれが安全側に働くように制御が行われるというものだ。また、誤り訂正という考え方もある。届いたデータが本当に正しいのかどうかを判別し、疑わしければ捨てて再送させたり自動的に訂正する仕組みだ。
こうした考え方を日本語入力システムがAIにディープラーニングさせることで、ユーザーは自分の入力ミスということに責任を負わずに期待した変換結果を得られることになる。頭の中ではこう入力したいと思っているが、指がそれを間違って叩いても、その間違いをなかったことにしてくれるわけだ。自分自身のミス傾向を把握できる「ATOKマンスリーレポート」まで提供されるというから徹底しているが、うまく自動修復が機能するのであればミス傾向なんて把握する必要もないのにと思ったりもする。
ただ、すでにベータテストが開始され、手元で使ってみているのだが、まだ、自動修復が行われたことがない。正確無比の入力をしているかというとそうでもなくて、あいかわらずミスタイプは多いのだが、まだ、恐る恐るチューニングという段階なのだろうか。発売まではまだ時間がある。誤入力と判断するしきい値をもう少し上げるなり、ユーザーがそれを調整できるようになれば、まさに日本語入力として完成の域に達するのではないだろうか。
と書いているうちに「にほんんごにゅうりょく」と叩いた入力ミスを修復され、「日本語入力」と入力できた。やるな。
(山田祥平 http://twitter.com/syohei/ @syohei)