米OpenAIは3月1日(現地時間)、「ChatGPT API」と「Whisper API」を発表した。
ChatGPT APIでは、OpenAIが現在ChatGPT製品で用いているモデルと同じ「gpt-3.5-turbo」を利用できる。料金は1000トークンあたり0.002ドル。システム全般にわたる一連の最適化によって、2022年12月からChatGPTの計算コストを約90%削減しており、GPT-3.5モデル(Davinci:1000トークンあたり0.02ドル)の10分の1の料金に抑えた。また、従来のGPTモデルが一連のトークンとして非構造化テキストを消費していたのに対して、ChatGPTモデルはChatML(Chat Markup Language)という新フォーマットによってメタデータとともに一連のメッセージとしてChatGPT APIにテキストを供給する。
すでに、いくつかのパートナーがChatGPT APIを採用したサービスの提供を進めている。
Snapはサブスクリプションサービス「Snapchat+」でチャットボットがおすすめ情報を提供したり、コンテンツ作成をサポートする「My AI」を提供し始めた。
オンライン学習ツールを提供するQuizletは、これまで単語学習や模擬試験など複数の学習ツールにGPT-3を利用してきた。さらにChatGPT APIを活用して、チャット体験を通じてユーザー個々の質問に対応するAIチューター「Q-Chat」を導入する。
食材デリバリーのInstacartは、同社独自の機械学習分析と75,000以上の小売パートナー店舗の商品データと共にChatGPTを使用し、今年後半に「Instacart」アプリで「Ask Instacart」というサービスの提供を計画している。「フィッシュタコスを美味しくするには?」「子供用のヘルシーなランチは?」というような食事と料理に関する質問に柔軟に回答し、チャットを通じて料理のひらめきを与える。
音声合成モデル「Whisper」は2022年9月にオープンソース化されており、Whisper APIの提供によって「Whisper Large-V2」モデルをオンデマンドアクセスでも使用できるようになった。料金は1分あたり0.006ドル。最適化されたサービススタックにより、高速なパフォーマンスを実現する。トランスクリプション(ソース言語の文字起こし)またはトランスレーション(英語への文字起こし)のエンドポイントを通じて利用でき、様々なフォーマット(m4a、mp3、mp4、mpeg、mpga、wav、webm)を受け付ける。