2024年、企業における生成AIの活用が本格化するなか、汎用的な大規模言語モデル(LLM)だけでは十分な精度が得られないという課題も浮き彫りになってきた。そんななか、注目を集めているのがRAG(Retrieval-Augmented Generation)だ。
2024年10月24日に開催されたグーグル・クラウド・ジャパン合同会社主催の技術カンファレンス「Generative AI Summit Tokyo ’24 Fall」において、株式会社G-gen 執行役員 クラウド支援部 部長 事業推進部 部長 金長源氏は、実際の導入事例をもとに、企業におけるRAGの効果的な活用方法とそれを実現するためのアプローチについて講演を行った。
生成AI活用の現状とRAG
金氏は冒頭、20年ほどのエンジニア経験を持つ自身の背景に触れ、企業向け検索エンジンやCRM/SFAなどBtoB領域での開発に携わってきたことを紹介。現在は、Google Cloud導入サポートやマイグレーションサービスを主に担当している。この1年は特に生成AIへの関心が高まっており、「PoCやワークショップ、アイデアソンなどを通じて、現場の声を直接聞いてきた」と語る。
生成AIの活用領域は、自然言語処理、画像認識による類似画像検索、コールセンター業務における音声認識、文書管理におけるOCRなど多岐にわたる。特に企業内で活発に導入されているのは、チャットボットだという。「LLMは自然言語処理が得意で、入力者の情報を補完しながら何をすべきか考えられるという意味で使いやすい」と金氏は説明する。
RAGは、質問と回答のプロセスのあいだに情報検索を挟むことで、精度向上を図るアプローチだ。従来の汎用的な利用では、AIに直接問い合わせる形だが、RAGでは回答を生成する前に関連する情報源を検索し、その情報をもとに回答を生成する。「グラウンディング」と呼ばれるこの手法により、LLMの汎用的な知識を特定分野に紐づけることが可能となる。
RAG構築時に考慮すべき5つのポイント
金氏は、RAG構築時の考慮すべきポイントとして以下の5点を挙げた。
- データの品質担保・更新・最新化
- 機密情報や個人情報の保護などのデータセキュリティ
- システム統合・既存インフラとの整合性
- パーソナライゼーション
- ユーザーインターフェースの改善
金氏は「業務効率化を目的として導入した場合、使い続けてもらうことが極めて重要。プロトタイプ的に導入し、ROIを測定したものの、結局使われなくなったり、ユーザーから使いづらいという意見が出たりするケースも多い」と指摘した。さらに、前提として、導入目的を明確にしておくことの重要性について、次のように強調する。
「活用を検討する際にまず考えるべきは、そもそも生成AIを使って何がしたいのかということ。社内活用を想定した汎用的なタスクの効率化を目指すのか、それとも社内の固有の情報資産を活用したいのか。この見極めが大切です」(金氏)
社内情報検索から顧客向けサービスまで、RAG活用の最新事例
続いて金氏は、具体的な生成AIの活用事例を紹介した。
大手建設業では、建築図面作成において、過去のレビュー内容や担当者間のやり取りを検索できるシステムを構築。70近くのPDFファイルに記された3000件を超えるレビューに対する一元的な検索サイトを作成し、調査時間の大幅な削減に成功した。
大手小売業では、社員向けマルチモーダル汎用チャットボットを開発。汎用的な質問への回答や商品説明を生成させるなどのアイデア出しから始め、閉域内での利用を前提に構築を行った。
大手不動産では、非エンジニアがBigQuery内のデータを自然言語で横断的に分析できるシステムを構築。非エンジニアでも6つのテーブルをまたがるSQLクエリを自然言語から生成して、データを検索・分析することが可能になったという。当初はLLMモデルにPaLM2を使用していたが、現在ではGeminiなどの利用も検討できる状況だと金氏は補足した。
鉄道会社では、すでに導入済みのGoogle Chatを活用した生成AIチャットボットを構築。業務の新しいツールの使い方を覚えずユーザーの負荷を下げた状態での運用を実現した。
インテリア内装材の製造・販売を手掛ける企業では、特徴量抽出とVertexAI/Matching Engineを利用した壁紙の類似画像検出システムのPoCを実施。社内に蓄積された壁紙データおよび顧客が求める壁紙の画像をもとに、類似商品をマッチングできるシステムを実現した。
RAG活用の最適解は、「Notebook LM風Chatbotシステム」
金氏は、企業内でのRAG活用における最適解として、Notebook LM風のChatbotシステムを提案する。
従来の中央集権的なファイルサーバー方式では、メンテナンスコストが高く、情報の更新に時間がかかるという課題があった。提案されたシステムは以下のサイクルで運用される。
- 社内の共通文書や社員が利用している文書の「収集」
- 個人情報や機密情報の「チェック」
- RAGのデータソースとしての「蓄積」
- 実際の「利活用」
システムの構成としては、Cloud Run、Vertex AI、Cloud Storage、Firestore、BigQueryなどのGoogle Cloudのサービスをフル活用することで対応可能だ。金氏が紹介した以下の構成例では、 閉域網内での安全な運用を実現しながら、利用者側とデータ側の両方に配慮した設計となっている。
「収集」「チェック」「蓄積」「利活用」という情報のサイクルを回す
最後に金氏は、「企業内でRAGを使う際の最優先事項は、『収集』『チェック』『蓄積』『利活用』といった情報のサイクルを回すこと」と改めて強調した。中央集権的なファイルサーバーの考え方から脱却し、分散した情報をいかに効率よく集めていくかが重要だという。「運用コストを下げながら、どう活用していくかを考えることで、必要な構成が見えてくる」というメッセージで講演を締めくくった。
生成AIに関するワークショップやプロトタイピングなども提供
G-genは本イベントでブース出展も行い、来場者と直接対話する機会も設けていた。ブースではNotebook LM風Chatbotをはじめとする生成AIサービスについて、実際のデモを交えた詳細な説明が行われた。G-genでは、今回紹介したような生成AIの活用支援に加え、ワークショップやプロトタイピング開発など、企業のニーズに応じた柔軟なサポートを提供している。
ソリューションエンジニアリング本部 営業部 SIセールス課 諸江昌高氏は、2024年7月に発表されたG-genとトップゲートの経営統合について触れ、「IT戦略の立案から開発、運用保守までをワンストップで提供できる体制を整え、お客様のDX推進において戦略フェーズからの一気通貫したサポートが可能になりました。生成AI活用についても、企業のビジネス戦略に即した提案が可能です」と説明した。
企業における生成AI活用はまだ始まったばかりだ。G-genは、Google Cloudのプレミアパートナーとしての強みを活かし、企業の戦略的なAI導入を支援していく。
[PR]提供:G-gen