世界中で注目を浴びた生成 AI 。現在は大手企業を中心に多くの企業が PoC を開始しており、2024年は日常業務により取り入れられるだろう。2月7日-9日に開催されたオンラインセミナー「TECH+ フォーラム AI Frontline 2024 Feb.~ビジネスをインテグレーションする~」では、G-gen クラウドソリューション部 又吉 佑樹氏と堂原 竜希氏が登壇。2024年初頭の生成 AI のトレンド、および各業界での生成 AI の事例紹介や事例を通して見えてきた生成 AI の特徴について解説された。
RAG、マルチモーダルが注目されるなか、社内データを活用したいという企業ニーズが高まる
G-gen では、同社エンジニアが技術的なサポートを行う「Google Cloud ではじめる Generative AI 活用支援ソリューション」を展開している。
同サービスに携わる堂原氏によると、ビジネス観点での生成 AI の傾向として、OpenAI の ChatGPT、Google の Gemini (旧称 : Bard) のように一般的な回答を生成するのではなく、社内レビューや問い合わせ履歴、営業資料、社内報など会社独自のデータを用いたいといったニーズの高いという。また、企業として生成 AI でやりたいことが明確になってきており、現状では各ベンダーが提供するモデルの精度や使用感を比較したいという相談が増えてきていることも明かす。
「AI は革新的な技術ということには間違いないのですが、精度やセキュリティなど実導入に伴って発生する課題にいかに対応するかが普及の鍵となります」(堂原氏)
技術観点では、2023年後半以降、LLM によるテキスト生成に社内データなど独自の情報を組み合わせる Retrieval-Augmented Generation(RAG) という手法が注目されるようになった。堂原氏によると、RAG は、特定のデータやノウハウを参照しながら作業することが推奨される業務、データが膨大で必要な情報を見つけるのが大変な業務、情報検索から回答までをすべて人が行っている業務などにおいて、その強みを発揮するという。
また、テキストや動画、音声などの複数形式のデータを扱えるマルチモーダルへの注目度も高い。Google は2023年12月、マルチモーダルに対応した最新モデルである Gemini を公開した。Gemini には、Ultra、Pro、Nanoというモデルサイズが用意されており、Pro は Google Cloud が提供する機械学習プラットフォーム、Vertex AI 上で一般の利用者も使える状態でリリースされている。
企業の生成 AI 活用最新事例
又吉氏と堂原氏は、実際にプロジェクトが進行中の生成 AI 導入事例を紹介した。
1.某建設業のケース
とある建設業では、PDF ファイルで蓄積された資料を検索できるサイトの構築を進めている。同検索サイトは、建設図面の作成において作業者がレビュー内容といった過去の情報を参照するために使用するものだ。具体的には作業者からの「遮音性の高い素材は?」「換気についての過去の指摘は?」という質問に対して、生成 AI が資料をもとに回答するイメージだ。
Google サイトまたは Google Chat として実装される予定となっており、構築期間は約2カ月。同プロジェクトの現状の成果として、70近くのPDFファイルに記されている3,000件を超えるレビューをもとにした検索サイトができあがっているという。
Google サイトに検索エンジンを埋め込んだ場合と Google Chat で実装した場合のイメージはそれぞれ以下のようなものとなる。
同システムは RAG の代表的な使用ケースであり、Google Cloud の回答生成システム Vertex AI Search を用いて構築されている。Vertex AI Search は、検索エンジンや LLM といった RAG のコアとなる部分を Google が構築・運用・保守するサービスで、ユーザーは対象としたいデータをクラウドにアップロードするだけで RAG を利用することができる。
2.某小売業のケース
とある小売業では、Gemini を用いて社員が利用する社内マルチモーダル汎用チャットボットを作成している。Webアプリとして実装し、汎用的な質問への回答や商品説明のアイデア出しなどに用いることで、日ごろの業務に対するパフォーマンス向上を狙う。構築期間は1カ月の予定。
社員のみが利用するため、Google 認証でのログインが必要となる。ログイン後は、入力ボックスに画像や動画ファイルのアップロードが可能となる。たとえば下記のような画像をアップロードすると、生成 AI が沖縄そばの画像であることを認識してJSONファイルを作成する。
このほかにも、画像中のテキストを読み込んで表として出力したり、動画から情報を取得し動画内のオブジェクトを指定した形式で出力したりといったことも可能となる。
この生成 AI 汎用チャットボットの技術要素としては、社内ユーザーに限定してアクセス制御できる点、顧客データを企業内にとどめて生成 AI の学習に使われないようにしている点、ログを蓄積することで各ユーザーの利用状況を可視化できる点の3つがポイントとなる。
3.某不動産業のケース
とある不動産業では、分析用データベースである BigQuery 内のデータを非エンジニアが自然言語でテーブル横断的に分析できるようシステムの構築を進めている。Teams のチャットボットとしての実装を検討しており、構築期間は5カ月を予定。
BigQuery は Google Cloud の中心的なサービスだが、データの操作には SQL の知識が必要で、非エンジニアにとってはハードルが高いといえる。また、どのテーブルにどのような情報が入っているかを把握していなければクエリを叩くことができないというデメリットもある。
そうした中、本システムは、Google の LLM である PaLM2 と、オープンソースフレームワークの LangChain を組み合わせることで、該当テーブルの洗い出し、SQL の自動生成、回答文の作成を実現している。
今後は、ユーザーが日本語で知りたい情報を入力することで、どのテーブルを見ればよいか、どのSQL を実行すればよいのかを自動で判別し、最終的な結果を自然言語で回答するといった流れを実現する構えだ。検証段階では6つのテーブルに対応した自然言語の回答が実現できており、最終的には約100のテーブルへの対応を目指していくという。
生成 AI の活用で実現できることと、ハンドリング方法
こうした事例をもとに又吉氏は、生成 AI によって実現できることとして以下の3つを挙げる。
- テキストの生成や要約による事務作業の自動化・効率化
- プログラムコードの生成や補助による開発プロセスの高速化・トラブルシューティングの効率化
- 類似検索・セマンティック検索による問い合わせ対応の自動化や検索結果の最適化
一方で、生成 AI 利用時の課題も存在するという。
まず、AI が間違った情報を生成してしまうハルシネーションが課題として挙げられる。これを抑制し、生成 AI が根拠に基づいた回答を生成できるようにするためには、RAG などの手法を用いることが有効となる。
2つめは、複雑なタスクへの対応。一般的に生成AIは1回のプロンプトのみで複雑なタスクへ対応することが難しい点だ。しかし、人間が複雑なタスクを1つずつ分解して考えるのと同様、生成AIもタスクを分解して推論と行動を繰り返し行うことで、問題解決能力を強化できる。こうした手法は ReAct と呼ばれており、自然言語で BigQuery 上のデータを分析する事例にも用いられている。
3つめは、汎用的な回答では適応できないケースもある点だ。特定のシナリオやコンテキストを深く理解した状態で回答を生成してほしい場合、Few-shot Learning やモデルチューニングを用いる必要がある。又吉氏によると、少量の入出力サンプルを用いる場合は Few-shot Learning を、サンプルを大量に用意できる場合はモデルチューニングを選択すると良いという。
企業内データを活用できる RAG を中心に生成AIの活用がより盛んに
堂原氏は「多くの企業は、自社で有するデータに基づいた独自の生成 AI を作成できる RAG に関心を寄せています。蓄積されているけれど活用しきれていなかったデータや企業特有の知識を取り込んだ回答生成ができる RAG を中心とした事例が今後は多く出てくることでしょう」と今後の見通しを示す。
G-gen では、今回紹介した活用事例と同等のものを各環境にチューニングして提供することも可能だ。また、Google Cloud の月額利用料5%オフで無償の技術サポートも付帯した Google Cloud 請求代行サービスも提供しており、生成 AI 活用支援ソリューションにおいても同サービスを利用することが可能だ。興味のある方は、ぜひ一度 G-gen のWebサイトをご確認いただきたい。
[PR]提供:G-gen