シマンテックは6月15日、AI/機械学習に関する取り組みに関する記者説明会を開催した。同社は、法人向けのエンドポイント製品「Symantec Endpoint Protection」や個人向けウイルス対策製品「Norton」など、さまざまなソリューションにAIと機械学習の技術を活用し、最新のマルウェア検知を行っているという。

今回、説明を行ったのは、太平洋地域担当 サイバーセキュリティ戦略マネージャーを務めるニック・サヴィデス氏だ。同氏は「機械学習はAIではない。AIと異なり、機械学習はパターンを学習する必要がある」と、AIと機械学習は違うという見解を示した。

Symantec 太平洋地域担当 サイバーセキュリティ戦略マネージャーニック・サヴィデス氏

サヴィデス氏は、機械学習の歴史を振り返ると、現実来なものになったのは2000年に入ってからと説明した。そして、「私は、2006年を機械学習の民主化の年と呼んでいる。機械学習が幅広く利用されるようになった。この年に、Netflixが機械学習をベースとした映画評価予測のアルゴリズムを競うコンテスト『Netflix Prize』を開催したことで、機械学習の知名度が上がった」と話した。

その背景には「コンピュータの能力が向上したこと」と「さまざまな人がプログラム能力を持つようになったこと」があるという。

ちなみに、同社では2008年から、ファイルのスキャン、ユーザーの異常行動の探知に機械学習の活用を開始した。

サイバーセキュリティ分野における機械学習の歴史

サヴィデス氏は、機械学習が用いられているサイバーセキュリティの分野として、「脅威検知」「ユーザー行動の分析」「異常探知」を挙げた。

「脅威検知」はエンドポイントに限らず、Security Operation Center(セキュリティオペレーションセンター)まで、利用を検討する必要があるという。ただし、ハードウェアのリソースが、SOCは豊富であるのに対し、エンドポイントは限りがあるため、「SOCとエンドポイントで同じモデルを使うとうまくいかない」と、サヴィデス氏は指摘した。

エンドポイントでは、機械学習により複数のモデルを利用して多数の特徴を観察することで、これまでは時間をかけないと不可能だった侵害の兆候(Indicator of Compromise)が見つかる可能性があるという。

そのほか、「非接続環境の保護」「OfficeのマクロやPDFのようなファイルレスマルウェアの検知と確信」「他の検知システムへのフィードバック」「自立型モデルの改善」というメリットを得ることができる。

エンドポイントセキュリティにおいて機械学習が実現すること

また、ネットワークはエンドポイントよりもリソースが多いので、より大規模なモデルが利用できる。これにより、人が行う調査について自動的に優先順位を付けることが可能になり、セキュリティアナリストの生産性の向上を見込むことができるという。

ネットワークセキュリティにおいて機械学習が実現すること

このように、サイバーセキュリティにおいてさまざまな利用メリットがある機械学習だが、「あらゆる保護テクノロジーと同様に攻撃にさらされている」と、サヴィデス氏は指摘した。

具体的には、攻撃者は機械学習に対し、モデル抽出、ポイズニング、回避を行っているそうだ。「攻撃者はクエリーをかけることで、機械学習のモデルを抽出しようとしている。また、ポイズニングとは、偽のデータをまくことで、それに基づく学習モデルを作らせようとすること。最終的には、検知から回避することを目指している」とサヴィデス氏。

昨今、AIや機械学習を製品やサービスに利用しているセキュリティベンダーはシマンテックだけではない。そうした競合に対するアドバンテージについて、サヴィデス氏は「機械学習のモデルの良し悪しは投入するデータによって決まる。われわれは、どのベンダーよりも多くのデータを保有している。というのも、エンドポイント、SOC、ネットワークなど、あらゆる場所でデータを収集しているからだ」とアピールした。

そして、サイバーセキュリティ分野におけるAI/機械学習の未来観測として、「機械学習はAIに進化する。これにより、単なる脅威の探知から攻撃の予測までできるようになる」との見方を示した。ただし、機械学習はAIにとってかわられるわけではなく、AIの一部になるのだという。この観測はシマンテックの計画でもあるそうだ。