米人工知能研究所・Open AIは、AIチャットボット「ChatGPT」の次世代言語モデル「GPT-4」を正式発表した。先日、今週中にもリリースされるかも、と話題となっていた言語モデルだ。画像からテキストを生成でき、精度も向上しているという。

  • ChatGPTの最新進化モデル「GPT-4」リリース、司法試験すら余裕? ネット「ビビる、進化早すぎ」

    ChatGPTの次期モデル「GPT-4」リリース、画像からテキストを生成できる

「GPT-4」は、マルチモーダルの言語モデルで、テキストはもちろん画像を使っての対話も可能となる。テキストと画像をあわせて入力すると、それに対してテキストを生成できるそう。たとえば、大量の風船が写った画像と「もし紐を切ったらどうなる?」と質問すると、「風船は飛んでいくだろう」と答えたり、卵などの食材が写る画像と「これらの材料で何が作れるか?」と聞くと、「たくさんの選択肢がある」として「パンケーキやワッフル、クレープ」などの例を提示したりできるようだ。

約2万5,000語のテキストを処理でき、長い文章や会話、ドキュメントの検索など幅広いケースに利用できるという。また、推論能力も向上しているそう。同社曰く「GPT-3.5よりも信頼性が高く、創造的で、より微妙な指示を扱うことができる」とのこと。

司法試験の模擬試験では、現在の言語モデル「GPT-3.5」が合格者の下位10%のスコアだったのに対して、「GPT-4」が合格者の上位10%と性能が向上しているそう。また、「GPT-4」と「GPT-3.5」を比較すると、事実に基づいた回答の確率が40%上昇しているという。

「GPT-4」は、月額20ドル(約2,650円)で使える「ChatGPT」の有料版「ChatGPT Plus」で既に利用できるが、記事執筆時点では、画像を使った入力は一般公開はされていない。

ネット上では「月々2700円。安いと思う。」「1日単位で技術が進歩してる、メイドインヘブンかな」「うわぁ、使いたいー!有料版にしようかなぁー」「まじでビビりますね、進化早すぎ」などの声が寄せられた。