マイクロソフトはこのほど、公式ブログにおいて、誰もが知っておくべきAI関連用語として10のテクノロジーを挙げ、解説した。ChatGPTの登場により、AIが再び注目を集めることになったが、AIについてちゃんと理解できていない人もいるのではないだろうか。または、理解できているようで、間違った知識を身に着けているかもしれない。
これから、AIはますます私たちの生活に入り込んでくるはず。ここで、AIに関する知識を確認してみてはどうだろう。以下、マイクロソフトが挙げている10のテクノロジーのポイントを紹介していくが、いくつ理解できているだろうか。
AI(人工知能)
AIとは、人の話を理解して決断を下し、言語間の翻訳をし、表現が否定的か肯定的かを分析し、さらに、経験から学ぶなど、何らかの点で人間を模倣できるスマートなコンピューターシステムを指す。
AIシステムは、膨大なデータをアルゴリズム (命令の集合) で処理することで、通常は人間の知性と時間を必要とする作業を自動化するためのモデルを作成する。
多くの場合、AIは人間の背後で処理を行い、文字を入力する際に単語を提案したり、プレイリストの曲を推薦したり、人間の好みに基づいてより適切な情報を提供したりしてくれる。
機械学習
AIが目標であるとするならば、機械学習はそこに至るための手段となる。コンピューターサイエンスにおけるAIの下位分野であり、パターンを識別し、それに基づいて予測を行えるようにコンピューターシステムを訓練することで、コンピューターシステムに何かを行う方法を教える。
機械学習はデータを何度も繰り返してアルゴリズムで処理し、その都度異なる入力とフィードバックを行うことで、システムが訓練過程で学習し、改善していく。
画像の認識や言語の翻訳など、従来のプログラミング技術では解決が難しい、あるいは不可能な問題で特に有効。機械学習の実行には膨大な量のデータが必要になるが、近年、多くの情報がデジタル化され、ハードウェアが高速化・小型化し、すべてのデータを処理できるようになったことで、機械学習が現実的になったという。これが、ChatGPTのような機械学習を活用した大規模言語モデル(LLM)が登場した理由だという。
大規模言語モデル (LLM)
大規模言語モデル (LLM) は自然言語処理のモデルで、機械学習を用いて言語を処理し、人間のコミュニケーション方法を模倣する。LLMは、人間の脳にヒントを得て、ニューロンとシナプスをシミュレートするノードとコネクションを集めたコンピューティングシステムであるニューラルネットワーク (NN) をベースにしている。
LLMは膨大な量のテキストで訓練され、人間の言葉を使うのに役立つ言語のパターンと関係を学習する。LLM の問題解決能力は、言語の翻訳、チャットボットによる質問への回答、テキストの要約、さらには、物語、詩、コンピューターコードなどの創作にも適用できる。
生成AI
生成AI (ジェネレーティブ AI) は、大規模言語モデルのパワーを活用し、既にあるものに関する情報を再生したり提供したりするだけでなく、新しいものを作り出すAI。パターンや構造を学習し、既存のものと似てはいるが新しいものを生み出す。
写真、音楽、テキスト、ビデオ、コードなどを作ることができるが、悪意のある人物がフェイクニュースやリアルに見えるが本物ではない写真を作成するために悪用する可能性もある。そのため、テクノロジー企業はAIが生成したコンテンツを明確に識別する方法の開発に取り組んでいるという。
ハルシネーション
生成AIは物語や詩、歌を創作することができるが、生成AIに対して事実に基づいた結果を求めることもある。このような場合、生成AIは真の情報と虚偽の区別がつかないため、開発者が幻覚 (ハルシネーション) や錯覚と呼んでいる不正確な応答をすることがある。
開発者は、この問題を「グラウンディング」という手法で解決しようとしているという。これは、特定のトピックに関する精度を向上させるために、信頼できるソースからの追加情報をAIシステムに提供することを指す。
責任あるAI
責任あるAIは、安全で公正なシステム設計で人々を導くガイドラインであり、機械学習モデル、ソフトウェア、ユーザーインタフェース、アプリケーションにアクセスするためのルールや制限など、あらゆるレベルで適用される。
AIシステムは人間によって作られ、不完全な世界のデータに基づいて訓練されているため、回答に固有のバイアスが反映されてしまう可能性がある。
責任あるAIの役割は、システムを訓練するために使用されたデータを理解し、特定のグループだけでなく、社会全体をよりよく反映できるよう、問題点を軽減する方法を見つけ出すこととなる。
マルチモーダルモデル
マルチモーダルモデルは、異なるタイプ (モード) のデータを同時に扱うことができるAIモデル。マルチモーダルモデルは、画像・音声・テキスト・数値など複数の情報を組み合わせて、質問に答えることができる。
プロンプト
プロンプトとは、AI に実行すべきタスクを指示するために、言語、画像、コードなどの形式でシステムに入力される命令のこと。LLMから望ましい結果を得るには、注意深くプロンプトを設計しなければならない。
Copilot
Copilotは、あらゆるデジタルアプリケーションにおいて、文章を書いたり、コーディングをしたり、要約したり、検索したりすることを手伝ってくれる個人秘書のような存在。
LLMの開発により、Copilotが人間の自然な言葉を理解して回答を提供したり、他のコンピュータープログラムで作業している間に代わりにコンテンツを作成したりアクションを起こしたりすることが可能になったという。
Copilotは、安全かつ安心で、正しく使われるよう、責任あるAIのガードレールに基づいて開発されている。Copilotとの関係において、主導権を握っているのはユーザーとなる。
プラグイン
プラグインによって、AI アプリケーションは基盤モデルを変更することなく、より多くのことができるようになる。プラグインは、AIシステムが新しい情報にアクセスしたり、複雑な計算をしたり、他のプログラムと会話したりできるよう支援する。