Facebookは5日、AI(人工知能)を活用した自動代替えテキスト機能を開発し、視覚障害者でも写真の内容を、より具体的に音声で把握できるシステムを開発したことを発表した。なお、現在iOS上で画面読み上げ機能を利用しているユーザーに対してテスト実施を英語で行っているが、順次他の言語、他プラットフォームにも広げていく予定。
同社オフィシャルブログより |
従来のFacebookでは、画面読み上げ機能(スクリーンリーダー)を利用しても、写真にさしかかると、写真をシェアしたユーザーの名前と"写真"という言葉が読み上げるだけであったが、今回のAIを使った自動代替えテキストにより、どのような写真なのかまでも音声で読み上げてくれるという。同社では、例として「画像には3人の人、屋外、笑っている」といった言葉を例示している。写真の解析には、何十億ものパラメータを持つ神経のように張り巡らされたネットワークを用いた物体認識技術を活用している。
同社では、「FacebookやInstagram、Messenger、WhatsAppでは一日あたり20億枚もの写真がシェアされています。写真などの視覚コンテンツをオンラインで共有することは、多くの皆様に楽しまれる表現手段として利用されていますが、一方で視覚障害者の方々には作成することも楽しむことも困難を伴うものです。世界で3900万人いるとされる全盲の方々や2億4600万人の弱視の方々をはじめとして、多くの方がFacebook上で写真を介したコミュニケーションの輪に入れないという思いをしているのではないでしょうか。」とその動機を述べている。また、機能は開発初期段階で今後も"写真の内容を説明する"というサービスの可能性を広げていきたい、としている。
同社公式サイトより |