人とコンピュータの関係を考えると、二者間には常にインタフェースが存在します。本連載では、人とコンピュータの間に介在するインタフェースに着目し、インタフェースとそれらを世に生み出すプロダクト開発について議論します。そしてHelpfeelが、独自のインタフェースを実装しながら、便利さと楽しさを備えたWebサービスをどのように開発しているのかについてお伝えします。
こんにちは、Helpfeel CTOの秋山です。2023年3月を境に、すっかり様変わりしてしまった世界を生きています。みなさんは世界が変わる瞬間を目撃したことはありますか?
「世界が変わった瞬間とはいつか」と聞かれたら、皆さんは何と答えるでしょうか。2001年の9.11同時多発テロ事件や2020年から始まったCOVID-19のパンデミックのような事件や災害を挙げる方もいれば、2007年のiPhoneの発売や2010年代の暗号資産(仮想通貨)の発展のように、テクノロジーの変化を挙げる方もいるでしょう。
2023年3月1日(日本時間で3月2日朝)に、米OpenAIが「ChatGPT」のAPIを公開しました。私は、この出来事が世界を大きく変えるきっかけになると思います。SNSでは、ChatGPTについてまるで蜂の巣をつついたような騒ぎになっています。既に日経新聞の紙面を賑わせ、テレビ東京の経済番組ワールドビジネスサテライトではChatGPT特集を組んでいます。なぜ人々は(そして筆者は)、これほどChatGPTに衝撃を受けているのでしょうか。
ChatGPTの衝撃
ChatGPTが最も衝撃的に捉えられている理由は、その高い自然言語処理能力にあります。以下は、筆者が実際にChatGPTに対して質問を投げかけた際の画面です。
従来のAIと比較して人間の発言を理解しているように見える上に、回答も適切です。このように、テキストで自然な会話を楽しむことができ、テーマによっては高度なアドバイスをもたらす点が大きな衝撃を与えています。
もう1つの衝撃的なポイントは、安価であるということです。ChatGPTは誰もが無料で利用できますし、2023年2月1日に発表された有料版である「ChatGPT Plus」でも、月額20ドルで利用できます。同年3月1日に発表されたChatGPTのAPIは、1,000トークンあたり0.002ドル(日本円で約0.25円)です。
英語の場合は単語や記号を1トークンとし、日本語の場合はひらがなを1トークン以上、漢字を2〜3トークンほどです。日本語の場合はざっくり文字数の1.5倍程度を想像すると良いでしょう。700文字ほどの日本語を処理するのにわずか0.25円程度しかかからないと思うと、想像しやすいです。実際のトークン数はOpenAI Tokenizerによって確認できます。この価格帯であれば、ちょっとした処理でも気軽にChatGPTのAPIを利用できることがお分かりいただけるでしょう。
また、ChatGPTを利用するときの敷居の低さも重要です。ChatGPTそのものを利用するには、メールアドレスとパスワードがあればただちに利用を開始できます。ChatGPTのAPIは、一般的なWeb APIと同様にHTTPリクエストにより利用でき、学習やセットアップに時間をかける必要はありません。こういった手軽さも、ChatGPTが驚きを持って迎え入れられ、SNS上で話題を呼び、ユーザーがユーザーを呼ぶ状況を生み出していると言っても過言ではないでしょう。
AIの民主化
2023年3月1日に、ChatGPTのAPIが高い自然言語処理能力を持ったまま安価に簡単に利用できるようになりました。なぜ、これによって世界が変わるといえるのでしょうか?それは、「AIの民主化」の時代が本格的に到来したからです。
テクニカルタームとしての「〇〇の民主化」は、特定の技術が誰でも安価に簡単にアクセスできるようになることを指します。近年では「ものづくりの民主化」といったキーワードがメイカームーブメントの文脈で登場しました。3Dプリンタやレーザーカッターの普及により、従来の製造業から個人で誰でも安価に簡単に物作りが実現できる状況を指す言葉です。AIの民主化とは、AIを誰でも安価に簡単に利用できることと定義しても良いでしょう。
従来であれば、大企業や大型資金調達したスタートアップ企業しか本格的なAIを活用することはできませんでした。AIの民主化は、中小企業や資金調達前のスタートアップ企業から個人の開発者に至るまで、どのような立場でも気軽にAIを活用したプロダクトを開発できるようになったことを意味します。
ChatGPT時代のプロダクト開発
ChatGPTの登場とAIの民主化は、プロダクト開発にどのような影響を与えるのでしょうか?まず、AIを活用したプロダクトがカンブリア爆発のように大量に生まれます。「量は質を凌駕する」といった言葉があるように、玉石混淆の中から真に有用なプロダクトが生まれ、生き残ることが予想されます。
プロダクト開発においては、気軽に使えるようになったAIを試し、プロダクトにどのように生かすかを柔軟に発想することが重要です。そのようなAIの活用事例としては、家入一真氏によるHOTOKE AIを見ると良いでしょう。このような高度で柔軟な発想のプロダクトが、ChatGPT APIの公開翌日にリリースされたことは、カンブリア爆発の比喩が大袈裟ではないことの証左です。
また、対話型インタフェースが台頭することは確実です。従来の対話型インタフェースは、ほとんどの場合はユーザーが期待する回答を取り出すことができず、役に立てることが難しいものでした。AIの民主化により、かつてのMicrosoft Officeに搭載されていたイルカのカイル君のようなエージェント型インタフェースや、事前学習が高コストだったチャットボットのようなシステムが復権する可能性があります。実際に、Microsoftは3月18日、Microsoft Office製品にエージェント型インタフェースであるMicrosoft 365 Copilotの搭載を発表しています。
一方で、対話型インタフェースを持たない機能に対してもAIが導入される可能性があります。ChatGPTは要約や翻訳といった自然言語処理能力の活用はもちろん、特定のタスクを自然言語によって記述可能です。特にGPT-4は画像とテキストを併用したマルチモーダルな処理も可能となる予定です。エンドユーザーに露出するインタフェースとしては従来のルック&フィールを維持しつつ、内部処理としてChatGPTを活用する実装は当然のように増えていくでしょう。筆者がChatGPTのAPI公開翌日にリリースしたHelpfeel Generative Writerは、このような考え方に基づいて開発しました。
このような大きな影響を考えると、AIの活用はより身近に普及すると予想されます。職場にパソコンが初めてやってきた時のように、あるいはADSLの普及によって高速なインターネット常時接続環境が当たり前になった時のように、ホワイトカラーの仕事は大きく変化し生産性は大幅に向上するはずです。プロダクト開発におけるAIカンブリア爆発元年では、産業革命の幕開けと言っても過言ではないほど大きな変化が起きるでしょう。
ChatGPT時代の課題
ChatGPTによって始まった新しいプロダクト開発には、新しい課題もあります。ChatGPTは仕組み上、入力された文字列に対してトークンごとに重み付けを行って次につながる確率の高い文を生成します。ChatGPTは意味や文脈を理解しません。確率的に可能性の高い文字列を生成しているだけです。したがって、現時点でのChatGPTは、事実の出力や調査には全くといって良いほど向いていません。
さらに悪いことに、ChatGPTは分からないことを「分からない」とは表現せず、もっともらしい文面を生成する可能性があります。この現象をHallucination(幻覚)といいます。SNS上でChatGPTのスクリーンショットとともに「〇〇(職業)はオシマイ」「調査をChatGPTに丸投げた」「判例が……」「診察が……」などと盛り上がっているツイートは、「幻覚」に巻き込まれてもっともらしい文面に勘違いしているだけの場合があるので要注意です。
また、ChatGPTに限らず対話型インタフェースには特有の課題もあります。それは、GUI(グラフィカルユーザーインタフェース)に対してのCUI(キャラクタユーザーインタフェース)と同様に、何を実行できるか分かりづらいという課題です。GUIとは異なり、対話型インタフェースは何ができるかという探索が困難で、ユーザーが想定しうる範囲でしか活用できません。SNS上で「〇〇ができた!」と話題になるのも、それを発見したという意外性があるからです。対話型インタフェースの開発においては、実行できる機能の示唆を補助することが重要になるでしょう。
UI上の手助けがあったとしても、ユーザーにとっては言語化そのものが難しいという問題もあります。SNS上では大量に素晴らしい出力結果が共有されていますが、その結果を得るために何度も試行錯誤した過程はあまり共有されません。特に共有されるスクリーンショットを見ていると、言語化能力が高く、分野の知識が深い人ほど良質な結果を得られているようです。単語や文章のつながりによって確率的に文を生成するわけですから、当然、良質な結果は良質な問いに依存します。果たして、良質な問いをどれだけの人が立てられるのでしょうか。
ここまで、Hallucination、対話型インタフェースの課題、言語化の課題、といったChatGPT時代における課題について紹介しました。プロダクト開発においては、これらの課題を理解した上でユーザーに価値提供できる方法を考える必要があります。
プロダクト開発戦略
2023年3月1日にChatGPTのAPIが公開されたことが、AIの民主化の火蓋を切り、まさに戦国時代がスタートしています。こうした時代に、プロダクト開発においてはどのような戦略を取るべきでしょうか。
歴史から学べることの一つとして、このような技術の転換点においては、とにかく早く動くことが価値になります。パソコンの普及、インターネットの普及、スマートフォンの普及といった、それぞれの超大型の転換点における勝者は、とにかく早く動いています。ChatGPTのAPI公開は、個人開発者から大企業まで、望むと望まざるとにかかわらず、もはや無視できるものではありません。
くしくも、本稿を書いているさなかにChatGPT pluginsが発表されました。これはChatGPT上でZapier(各種システムと連携するためのハブとなるWebサービス)やOpenTable(海外で人気のレストラン予約サービス)といった各種システムと連携できるようになるというものです。SNS上では、ChatGPTが全てを飲み込む、ChatGPTがプラットフォームになる、といった言説が飛び交っています。
ただし、ChatGPTがどれだけ発展しようとも、すべてのプロダクトをディスラプト(破壊)することはありません。ChatGPTは汎用人工知能(AGI)になる可能性を秘めてはいますが、全知全能の神ではありません。しかし同時に、あなたのプロダクトの福音となる可能性もあります。いま一度、あなたのプロダクトが誰のどんな課題を解決しているのかを考え、本質的な価値提供に向けて爆速でAI活用に動き出してみてはいかがでしょうか。