11月20日から22日までパシフィコ横浜では、エッジテクノロジーに新たな“プラス”で顧客起点の価値創出を実現する展示会「EdgeTech+ 2024」が開催された。
事業変革期を迎えた現代における最新技術が集結する同展示会で、インテルは、同社が無償で提供するAI開発用推論エンジン・ツールの「OpenVINO」ツールキットを活用したさまざまな事例を紹介。また併せて、生成AIやRAG(検索拡張生成)を活用したインテル独自のソリューションを提案した。
映像におけるGPU不要の生成AI活用例を提案するインテル
急速に普及が広がるAI。その活用方法は多岐にわたっており、画像認識AIについてはすでに実用化の行きに至っている。また対話形式で問いかけに対する答えを生成するチャットボットは、もはや日常的なツールになった。さらに生成AIのユースケースも画像にまでおよび、入力されたプロンプトを基に画像を生成する“Text to Image”も一般化している。今回のブースでも、メインメモリを同一のダイに集約し演算における消費電力を抑えたCPU「インテル Core Ultra プロセッサ(シリーズ2)」を用いたデモとして、同CPUを搭載したPCを用いて画像生成AI「Stable Diffusion」を用いた画像生成が実演された。
そしてインテルが新たに提案するのが、映像への生成AI活用だ。今回紹介されたのは、監視カメラ映像を言語化するソリューション。あるデモでは、映像を2.5秒ごとにまとめてテキスト化しすることで、店内監視を効率化できるとする。また特定の内容(不審者の行動など)についてはLVM(ラージビジョンモデル)を適用し、その内容を検知した際には素早く関連するビデオクリップを抽出可能とのこと。インテルの担当者は、「これらの処理をGPUを用いずにXeonプロセッサのみで達成できる点も我々の強み」と話す。
動画の内容を言語で検索するRAG活用ソリューションも
また言語化ソリューションとは異なるプロセスとして、RAGを活用したカメラ映像検索機能も紹介。こちらは映像をベクター化した状態で保つといい、ユーザーからの検索や問い合わせをLLMによって処理し、それに対応するベクターデータを引き出してからLLMによって新たな回答を生成することで、映像の検索機能を実現したとする。従来は言語での検索が難しかった映像に対しても、RAGを用いることで回答が可能に。ユーザーからの幅広い要求に対応できるようになったとした。