=企業内の文書(ドキュメント)を検索する技術として登場した「エンタープライズサーチ」。本連載では、2回にわたってこの技術の発展と応用の経緯をたどってきた。最終回となる今回は、エンタープライズサーチの新たな潮流について概説する。

「ChatGPT」でわかるエンタープライズサーチの進化の方向性

読者諸氏は昨今話題の「ChatGPT」を試されただろうか。 ご承知の方も多いだろうが、ChatGPTは、OpenAIが開発した大規模な自然言語処理モデルだ。大量のテキストデータを学習することで、人のように自然な文章を生成したり、自然言語での問いに答えたりすることができる。

現在、こうしたAI(人工知能)技術を使った自然語処理によって、検索エンジンの役割や概念が変容しつつある。これは、検索技術の新たな潮流といえるものだ。

従来の検索技術は、キーワードを頼りに、膨大な数のコンテンツの中から、キーワードに関係するコンテンツを取り出してくるだけのものだった。それが自然語処理技術と結びつくことで、例えば、ChatGPTのように自然語で入力された「問い」を意味的に解釈し、膨大なコンテンツを参照しながら、人の言葉で「答え」を生成して返すような仕組みへと進化する。また、市場では、検索技術とAI技術を使い、テーマに沿ったプレゼン資料のアイデアを人の要望に応じて自動で生成するような仕組みもすでに存在している。

検索技術はこれまでも、人による情報探しをアシストしてきたが、これからはAI技術と結びつき、人の目的やニーズに寄り沿った情報提供を行う仕組みへと発展していくだろう。

そしてそれは、企業内検索についても同様にいえることだ。エンタープライズサーチでも、ディープラーニング(深層学習)などによって作られた自然語処理モデルを取り込み、自然語による情報の検索を可能にしたり、自然語から人の感情を読み取るセンチメント分析を実現したりすることが可能になっている。

  • 事前後処理モデルを使ったセンチメント分析のイメージ

例えば、Elasticsearchでは、事前学習済みの自然語処理モデルを「Hugging Face」サイトで公開しているが、PythonでElasticsearchを操作するためのライブラリの1つである「eland」を使った簡単なコマンド操作でそのサイトにあるモデルをインポートし、自然語で書かれた文章のセンチメント分析などに応用できるようになっている。

  • Elasticsearchにおける自然語処理モデルのインポート準備のイメージ

こうしたエンタープライズサーチとAI技術の融合によって、例えば、BtoCのEC(電子商取引)サイトを運営している企業では、自然語のテキストや音声による顧客の問い合わせにシステムが的確に、かつ自然語で答えやアドバイスを返す仕組みが作れるようになる。つまり、顧客の情報探しをアシストするツールから、店舗のスタッフのような接客を行える仕組みへと進化させることができるというわけだ。また、AI技術を取り込むことにより、エンタープライズサーチは、BtoBの商取引においても、顧客企業(バイヤー)の課題や目的を自然語から解釈し、さまざまな提案や問い合わせへの対応を行うような仕組みとして役立てられていくはずである。

データの収集と取り込みにおける革新

エンタープライズサーチにおけるもう一つの潮流として注目すべきは、データを収集する方式、あるいは取り込む方式の強化・拡張だ。

例えば、最新のテクノロジーではデータの収集・取り込みを効率化する技術としてWebクローラーが使用できるようになっている。この機能を使うことで、例えば、大規模なWebサイトをクローリングして、サイトにある情報をすべてエンタープライズサーチのデータベースに取り込み、かつ、情報の更新をトリガーにして新しい情報を適宜取り込んでいくことができるようになる。

また、日常的なオフィス業務に広く使用されているツールとエンタープライズサーチとを結ぶコネクタも充実度を増している。これらのコネクタを用いることで、メールやチャットツール、グループウェア、ストレージ、CRM/SFA(CRM:Customer Relationship Management、SFA: Sales Force Automation)ツールなどからデータを取り込み、各種のツールをまたいだ横断的な検索が可能になる。

進むクラウドプラットフォームとの融合

近年では、上述したようなオフィス業務用のツールだけではなく、GCP(Google Cloud Platform)やAWS(Amazon Web Services)、Microsoft Azureといった主要なクラウドプラットフォームとエンタープライズサーチとの連携も強化されている。これにより、クラウドプラットフォームのデータを検索に取り込み、第1回で説明した「CQRS(コマンドクエリー責任分離)」のアーキテクチャ(=データの読み取り操作と更新の操作を分離させるアーキテクチャ)のもとで、クラウドプラットフォームに蓄積された膨大な数のデータに対する検索・集計を高速に行うといった潮流も生まれている。

例えば、エンタープライズサーチとGCPのモバイル&Webアプリケーション開発プラットフォーム「Firebase」やドキュメントデータベース「Firestore」を、GCPのサーバレスコンピューティング環境「Google Cloud Functions」を介して連携させたとしよう。こうすることで、CQRS アーキテクチャのもとでFirebase/Firestore内の情報を、エンタープライズサーチのエンジンを使って検索・集計することが可能になる。

結果として、Firebase/Firestore内に日々更新・蓄積されていく情報が何十万件、何百万件に上ったとしても、情報を更新する側には一切負荷をかけることのない、きわめて高速な全文検索・集計が行えるようになる。

  • 「Firebase/Firestore」とエンタープライズサーチで構築できる検索環境の例

こうしたエンタープライズサーチとクラウドプラットフォームとの連携は、第2回で説明した企業システムのオブザーバビリティ(可観測性)やセキュリティ監視を確保、強化するうえでも有効である。例えば、クラウドプラットフォームをシステムの開発や運用に用いており、ログやインフラのメトリクス(CPU使用率、メモリ使用率、ディスク使用率など)を収集し、蓄積していたとしよう。

そうしたデータと、オンプレミスで運用しているシステムのメトリクス、ログを併せてエンタープライズサーチに取り込み、かつ、アプリケーションパフォーマンス監視(APM)の機能を組み込むことで、企業システム全体の状態─すなわち「いま、自社のシステムで何が起きているか」を観測・可視化するオブザーバビリティやセキュリティ監視の仕組みが実現される。また、その仕組みにAI技術、あるいは機械学習の技術を組み込むことで、システム障害の予兆を検知したり、未知のサイバー攻撃を発見したりすることも可能になるのである。

エンタープライズサーチの進化がもたらすメリット

かつてのエンタープライズサーチは、複雑なUI(ユーザーインターフェース)を持ち、ユーザーにさまざまな条件を入力させる(あるいは選ばせる)ことで情報を探し当てていた。その使い勝手は決して良くなかったが、クローリングの技術やインデックシングの技術が非常に高価であったことから、普及が進んだといえる。

それが現在は、検索技術とAI技術などとの融合によって、自然語を通じて人と対話し、人が欲する情報を速やかに探し当てる(あるいは作り上げる)ことが可能になっている。言い換えれば、検索技術の進化やAIによる情報検索UIの革新によって、旧来のように「検索窓」といった特殊なインタフェースを使うことなく、自分が本当に必要な情報だけを、検索の方法を間違えるようなことなく探し当てられるようになってきたということだ。そしてそれは、ChatGPTのような仕組みのみならず、オブザーバビリティソリューションにおけるシステム状態の可視化、また障害検知の仕組みなどにおいても同様に見られる検索技術の進化といえる。

AIによる自然語処理モデルは、機械学習の積み重ねによって今後さらに洗練されていくはずである。そうなれば、検索技術は、膨大な情報を瞬時に調査する能力を備えつつ、人に限りなく近い意思疎通ができる仕組みとして、人、組織、ひいては企業の生産性を大きく向上させることになるのではないだろうか。