説明書を読まなくても使い方がわかるのが、iPhoneの魅力であり強みです。しかし、知っているつもりでも正しく理解していないことがあるはず。このコーナーでは、そんな「いまさら聞けないiPhoneのなぜ」をわかりやすく解説します。今回は、「Siriで「聞き書き」や「テープ起こし」はできる?」という質問に答えます。

***

正確にいうと、Siriは命令伝達系の機能であり、文字ベースの情報をシステムに伝えさまざまな処理を行うためのものです。音声データを文字ベースの情報(日本語や英語の文章)に変えるのは、クラウド上に存在する他社製音声変換エンジンの仕事であり、Siriはその結果をiOSに命令として伝える役割を担います。

その音声データを文字情報に変える処理は、Siriとは明確に分離されています。「メモ」や「メール」など文字入力が可能なアプリを起動し、ソフトウェアキーボード(日本語モード)のスペースキー左横にあるマイクボタンをクリックしてみましょう。Siriを呼び出したときと同じ効果音のあと音声入力モードに変わり、そのあとiPhoneに話しかけた言葉がカーソル位置に入力されます。

iOSの音声入力機能は、iPhone内蔵のマイクが聞き取った音をクラウドへ送信し、各国語の文章に変換されたものを文字データとして受け取ります。クラウドではかな漢字変換処理も行われるので、「きしゃのきしゃはきしゃにきしゃした」と話しかければ「貴社の記者は貴社に帰社した」という文字列が返ってきます。

しかし、iOS 7の現在、聞き書き(話し言葉をそのまま文字データに変換)できるほど音声入力機能は高速/高性能ではありません。話しかけたあと文字データがクラウドから返ってくるのは、ひと呼吸おいてからです。会話の様子をそのまま文章化する「聞き書き」や「文字起こし(テープ起こし)」に使うには、荷が重すぎます。

もっとも、この状態が将来も続くわけではありません。あくまで噂ですが、聞き書きが可能になるほどiOSの音声入力変換がスピードアップする日は近いともいわれています。そうなれば、記者会見のやり取りそのままをほぼリアルタイムに文字化して報道に使う、といった人が現れるかもしれません。

iOS 7の現在、「聞き書き」に使えるほどの変換速度はありませんが、かな漢字変換を含めかなり正確に話し言葉を文章化できます