McAfeeが来年度のサイバーセキュリティ脅威トレンドを予測するレポート「McAfee Labs 2018 Threats Predictions Report」を発表した。McAfee LabsとCTOオフィスに調査してまとめたもので、機械学習、ランサムウェア、サーバーレスアプリ、プライバシーなど5項目に大きなフォーカスが当たっている。ここでは機械学習を取り上げたい。
人間と機械がチームを組むことがサイバーセキュリティでは重要になっている。人間の判断をまとめ、機械のスピードで意思決定をし、パターン認識をする。機械学習はすでに脆弱性の検出と修正、疑わしい行動の識別などでセキュリティに貢献している。これにはゼロディ攻撃も含まれている。つまり開発者のパッチ修正提供よりも前に、セキュリティに対する攻防が機械学習など先端の技術で行われており、ユーザーはこの恩恵を受けていることになる。
2018年に起こるセキュリティにおける機械学習攻防
しかし防御側だけが強くなるわけではない。2018年は"機械学習の軍拡攻防"になるとMcAfeeは予想している。機械学習を使って攻撃を作る動きが増え、機械学習とAIの組み合わせを試し、防衛に用いる機械学習を発見して破る動きが多く見られるはずだと予測している。
2018年のどこかの段階で、研究者が攻撃をリバースエンジニアリングして、ある種の機械学習を用いた攻撃であると証明するだろうと述べている。同社ではすでに、脆弱性を探すブラックボックス攻撃を確認しており、これまでのモデルを踏襲しないため、検出が難しいもので攻撃者がこのようなツールの使用を増やす傾向にあることも明かしている。
無限に想定される機械学習の悪用
攻撃者はどんなことに悪用できるだろうか?レポートでは、簡単な例も示している。機械学習は人間よりも多くのデータを集めて合成できることから、ソーシャルエンジニアリングを改善することができる。つまり、フィッシング攻撃を見破られにくくすることができるという。また、インターネットに接続されたデバイスのログイン情報を弱くしたり盗むことができる。さらには、攻撃者が脆弱性情報をスキャンして攻撃の速度を加速し、発見から攻撃までの時間の短縮にも利用される。
守る側が新しいものを見出すと、攻撃者はそれについてできるだけたくさんのことを学ぼうとするのは、今にはじまった話ではなくマルウェアの署名やレピュテーションシステムなどセキュリティを支えてきた技術でも同様であり機械学習でも同じことが起こるだろうと予測している。プロービングしてモデルのマッピングをする、公開されている研究やパブリックドメインの素材を読むなど機械学習を進化させてマルウェアの浸透を図りやすい環境を構築していく。大量のデータから有意義な兆候を紡ぎ出す機械学習には悪用可能な方法はいくらでもあるようだ。
守る側ができることは?
守る側も機械学習、AI、ゲーム理論を組み合わせてソフトウェアとシステムに対して脆弱性のプロービングを行い、犯罪者が悪用する前に欠陥を修正する。これはペネトレーションテストを次の段階へ引き上げたようなものになるとしている。また当然現在と変わらず多層防御の考え方は必須になる。守る側もエンドポイント、クラウド、データセンターなどでのモデルの階層(独立して運用する)で対応が必要になるとしている。 また機械学習のモデル作成にあたって最大の課題となるのが、データの収集だが、この分野もさらなる前進が期待できると守備側のセキュリティベンダーの立場として、この分野での大きな躍進が来年にあるだろうと予測している。
データ、接続性、電気があればどんな人でも使える機械学習。我々は攻撃者よりも速く機械学習を前進させ、我々のモデルが検出されたり崩壊されないようにする必要がある。人間と機械の協業により、そのメリットを防御する我々の方に止めることができるはずだ、と機械学習の平和利用のために一歩でも先に進んで対応していかなければならないとまとめている。