米テック産業のリサーチには英語が不可欠です。英語の記事を検索するために英語のキーワードを入力するなど、私はこれまで英語コンテンツを調べるために英語を使用していました。
しかし、今はChatGPTアプリで、英語秘書GPTに「なんかGTA5のソースコードがリークしたみたいだけど本当?」と音声(日本語)で気軽に質問するだけで、自動的にプロンプトに整えて英語コンテンツの情報を収集してくれます。
シリコンバレーでAIについての議論になると、映画『her/世界でひとつの彼女』の例がよく引用されます。これまではSFの世界の話という距離感がありました。しかし、私の仕事用のGPTは単なるテキストチャットですが、ざっくりとした質問でも意図を理解し、時には叱咤激励の返答もしてくれます。ソフトウェアやサービスに対する以上の親近感を覚えます。
この体験から、次のステップは容易に想像できます。私のクセを知り、私のアクティビティを覚え、必要なサポートを提供し、私の好む方法で楽しませ、相談にも乗ってくれるボットです。AIボットはよりパーソナルになり、感情に基づいてより正確に反応し、また特定分野の知識を備えて専門的な問い合わせやタスクを効率的に処理できるようになるでしょう。
それによりオンデバイスAIのニーズが高まると、PC産業やスマートフォン産業はデバイス上で生成AIを高速に処理するための強化に努めています。「AI PC」に続いて「AI Phone」という言葉も使われるようになりました。
オンデバイス処理の最大の利点はセキュリティとプライバシーです。個人情報、財務情報、医療情報などセンシティブな情報をデバイス内で管理できるので、AIを活用する範囲を広げられます。また、位置情報、デバイス利用から得られるユーザーの好みや行動のデータを基に、よりパーソナライズされたAIアシスタントを提供することも可能です。オンデバイス向けのAIモデルは軽量ですが、通信がボトルネックになるクラウドサービスに比べて多くの用途で待ち時間や処理時間を短縮できます。そして、生成AI普及の障害になっているデータセンターの負荷とエネルギー消費についても、オンデバイスに分散することで大幅に削減できると期待されています。オンデバイスAIへのシフトは、生成AIの成長に欠かせないものなのです。
この業界で最もプライバシー保護で定評を得ているのがAppleです。同社は生成AIにおいて出遅れていると見なされがちですが、多数の生成AI関連論文を発表し、Apple製品の多くに機械学習や生成AI技術を活用しています。AppleはAIに関して、基盤技術として発展を後押しするDarwinやWebKitと同様のアプローチを取っていると考えられます。
Appleは今年、空間コンピュータ「Vision Pro」を発売します。現実とデジタルをシームレスに融合し、ユーザーの空間を拡張するデバイスです。内蔵カメラで高精細にキャプチャした周囲の映像に3D映像を重ねるビデオシースルー方式を用いています。
Vision Proの注目すべき特徴は、12ミリ秒以下というセンサーとディスプレイ間の通信遅延の驚異的な短さです。Vision Proの発表で、私はミラーレスカメラが登場し始めた頃のビューファインダー論争を思い出しました。OVF(光学ファインダー)に対して、EVF(電子ビューファインダー)はデジタルカメラの利点を生かせる表示ですが、表示のラグがカメラ愛好家に嫌われました。XR(クロスリアリティ)でも、これまでラグがVR酔いや操作のもたつきといった不快な体験の原因になっていました。AppleはM2チップとは別にセンサーデータ処理専用のR1チップを用意し、OSにはリアルタイム実行エンジンという、車載システムでも通用しそうな構成で遅延のない体験を実現しています。
このARとVRの境界のない体験を実現するため、価格は3,500ドルです。手頃な価格帯を優先して目指す体験を損なっては意味がないというのがAppleの考えなのでしょう。だから、Vision “Pro”であり、価格よりも生産性を重んじるユーザーを対象に設計されています。加えて、ヘッドセットには「装着する」という手間がありますが、仕事はその障壁を克服させる確かな目的になります。