先日、GPT-4がチューリング・テストにおいて高い合格率を出したという論文がオンラインに公開された。Copilot in WindowsやCopilot in Edgeで使われている言語モデルはGPT-4だと言われている。これはCopilotとの会話が人間らしいものであることを示すひとつの例となる。興味深い内容なので今回はこの件について簡単に取り上げる。
連載「Copilot in Windowsを使ってみよう」のこれまでの回はこちらを参照。
人間と区別が難しくなっている? GPT-4
Copilot in WindowsやCopilot in Edgeでは大規模言語モデル(LLM:Large Language Model)としてGPT-4が使われているとみられている。
先日、このGPT-4がチューリング・テストで54%という高い合格率を示したことを示す論文がオンラインに公開された。
興味深い内容なので今回はチューリング・テストやこの論文が指摘している内容を取り上げる。
チューリング・テストとは
コンピューターサイエンスの分野で有名な概念であり思考実験のひとつにいわゆる「チューリング・テスト」と呼ばれるものがある。チューリング・テストは科学者アラン・チューリング氏が1950年に発表した次の論文で提案された概念を示す言葉として使われることが多い。