サイバーセキュリティにおける深層学習（ディープラーニング）の活用は十分か？

人口知能（AI）は複雑な意思決定をデータに基づいて解釈および実行する機能により、タスクまたはプロセスが人間のようなインテリジェンスで機能することを可能にします。この技術の活用によって、昨今のデジタルトランスフォーメーション時代では様々な業界に新しい価値をもたらしています。サイバーセキュリティ業界もAIの恩恵を大きく受けている多くの分野の1つです。本記事ではエンドツーエンドの深層学習（Deep Learning、ディープラーニング）の活用について、調査結果を元に論じます。

■サイバーセキュリティ分野でのAIの活用

現在サイバーセキュリティ分野では、未知の脅威も含めた広範囲の脅威を検出するセキュリティソリューションを提供についてAIを効率的に応用することが試みられています。ただし、AIを利用するには様々な工夫が必要となります。モデルの精度を向上させる反復手法と共に、データに対して正確にラベル付けするプロセスが重要です。もう1つ重要なのはドメインナレッジに基づいた特徴設計です。これらのプロセスでは、データを前処理して特徴を抽出/設計する脅威の専門家が手動作業によりサポートしています。この専門家のサポートによりモデルの動作の曖昧さを押さえることが可能になり、脅威の検知機能の強化に寄与しています。

一方、エンドツーエンドの深層学習ではドメインナレッジによる特徴設計を不要とする手法も出てきています。これまで入力から出力へ変換するにあたり人間が手動で行う必要があった特徴設計を自動的に行うものです。深層学習を活用すると専門家がデータの特徴設計を繰り返し行う必要がなくなり、自動化されたプロセスに置き換えることができる、つまり、専門家が手動でデータの特徴を設計する必要はないのではないか、ということです。

AIを活用する業界の一部ではこの手法が受け入れられやすくなっているのは間違いありませんし、一部のセキュリティベンダにおいても次世代のマルウェア検知技術として宣伝されているようです。ただし、専門家を不要とする深層学習がサイバーセキュリティ業界においても最適な方法であるのかについては、改めて議論する必要があるようです。

■マルウェアを検出するソリューションでエンドツーエンドの深層学習を活用する

エンドツーエンドの深層学習に関する研究の一部では、AIモデルに提供される検体のテストとトレーニングの過程で、専門家による手動の特徴設計に頼らない方法が提案されています。2020年に発表されたある手法では、グレースケール画像としてプロットされたマルウェアのバイナリを検査し、同一のマルウェアファミリと異なるマルウェアファミリのバイナリ間、またはマルウェアと無害なソフトウェア間のテクスチャや構造の類似点や相違点が明らかとなりました。これにより、手動での特徴設計プロセスが回避され、結果的にサイバーセキュリティ企業の作業負荷が軽減されます。2018年に発表された別の手法では、RAWバイト値からなるRAW入力をエンジンに与え、不正なファイルと無害なファイルの分類を示す出力を生成するプロセスがあります。

ただしこれらの手法についての検証結果は、エンドツーエンドの深層学習モデルのトレーニングとテストに使用されたファイルの詳細は、機密保持の理由から非公開となっています。これによって、残念ながら使用したAIモデルの動作結果について詳細を得ることが困難となっています。特にこの調査では、検出されやすい未知のマルウェアの検体の割合と検出されにくい検体の割合を明らかにすることができませんでした。このような情報は、サイバー犯罪者が現在継続的に開発している複雑で未知の脅威を積極的に検知するのに適切なソリューションであるかどうかを判断する上で非常に重要です。

■エンドツーエンドの深層学習モデルの検出率を測定する

２０１７年、初期のエンドツーエンドモデルのひとつを検証する試みとしてトレンドマイクロの専門家が実験を行いました。トレンドマイクロでは慎重に収集された検体で構成される実験用のデータセットを使用しました。このデータセットは２つの手法のトレーニングとテストに使用されました。一つはエンドツーエンドの深層学習を用いて特徴設計を自動化した手法、もう一つは専門家の手作業の特徴設計を含む機械学習手法です。後者を、本記事では「エキスパートAI」と呼称します。２つの手法の検出性能を比較してより明確なイメージを描くために、これらのデータセットは「Trend Micro Locality Sensitive Hashing（TLSH）」のクラスタリング結果に応じて２つの手法で整理しました。

このデータセットは、データセット「Type A」と「Type B」に整理されています。Type Aでは、トレンドマイクロの専門家が各TLSHクラスタからひとつの検体を選択してトレーニングセットを作成し、残りの検体を各クラスタから選択してテストセットを作成しました。これは、テストセット内のすべての検体がトレーニングセットに類似の検体を持っていたことを意味します。Type Bに関しては、専門家は訓練データセットと試験データセットにおいて、クラスタを全体として選択して実験を行いました。これは、テストデータに含まれる検体がトレーニングデータに含まれる検体と大幅に異なる可能性があることを意味します。理論的には、Type Aのテストデータはテストデータと非常に類似しているため、モデルがすでにType Aのトレーニングデータを認識していた場合、検出が容易だったかもしれません。

実験の結果は、Type Aの場合、エンドツーエンドの深層学習が99.39％の精度を達成し、エキスパートAIが99.87％を達成したことを示しました。

図：Type AおよびType Bとラベル付けされた実験データセット
エンドツーエンドの深層学習手法とエキスパートAIを用いてトレーニングおよびテストされた

Type Bでは、エンドツーエンドの深層学習が92.49％の精度を達成した一方で、エキスパートAIは95.21%を達成しました。Type Aではエンドツーエンドの深層学習とエキスパートAIの性能差にはごくわずかな違いしかありませんが、Type Bではエンドツーエンドの深層学習よりもエキスパートAIの方が2.72％優勢で、困難で未知の検体を検出するという点ではエキスパートAIの方が優れていました。この実験結果からは、専門家の手作業の特徴設計を利用したエキスパートAIの方が、未知の検体を検出するという点で、近似的なエンドツーエンド深層学習モデルを多少上回ったものと言えます。

モデル	Type A	Type B
エキスパートAI	99.87%	99.39%
エンドツーエンドの深層学習	95.21%	92.49%

表：エキスパートAIとエンドツーエンドの深層学習での未知検体検出に関する実験結果

また2018年に実施された別の調査でも、上記の調査結果と同様の傾向が示されました。この調査では、2,000万個もの解凍された0.5MBのPortable Executable（PE）ファイルのデータセットを用いて実験が行われました。

■エンドツーエンドの深層学習でも「専門家の知見」が重要

上述のトレンドマイクロによる実験かでは、エンドツーエンドの深層学習が、ノイズキャンセリングの点でマルウェア検出に革新的であることは言うまでもなく、印象的な手法であることが明らかになりました。しかし実験では、未知の脅威を検出する場合に、専門家の手による入力でサポートされるAIソリューションを多少下回る結果となりました。

もう一つ特筆すべき点として、エンドツーエンドの深層学習に関心を持つサイバーセキュリティ企業は、マルウェア検出技術を強化するために、新しいネットワークアーキテクチャや学習スキームに投資する必要があります。該当する事業体の中には、例えば、コンピュータビジョン領域からの伝達学習技術を利用して、モデルの学習に必要な消費データ量を削減するベンダがあるかもしれません。トレンドマイクロの観点からは、本記事で紹介した実験におけるRAW画像ファイルは、実際には、専門家が設計したパーサを介してフォーマットされた画像ファイル（JPEG、TIFF、PNGなど）から抽出されたビットマップ配列の値であるというのが重要な点です。JPEG、TIFF、PNGなどの複雑なファイル形式に対して直接深層学習を適用すると、モデルの性能が低下する可能性があります。つまり、WindowsのPEファイル形式やOSのバージョンが異なる様々なバリエーションを持つLinuxのELF実行ファイルに含まれるマルウェアを検出する場合、単に深層学習を使ってRAWファイルから学習するだけでは十分な検出能力が得られない可能性があることになります。専門家の手作業による特徴設計が過程から削除された場合、ベンダはこれらの問題を慎重に検討する必要があると言えます。

例えば、APT攻撃ではマルウェアが多くのコンポーネントに分割されており、さまざまな攻撃の侵入経路に分散する可能性があります。従来のあるいは不十分なサイバーセキュリティソリューションでは、各コンポーネントが無害なファイルとして検出される可能性があります。このようなシナリオでは、エンドツーエンドの深層学習に頼ったソリューションには限界があるかもしれません。現時点では、より効果的なサイバーセキュリティ戦略には深層学習を含むAIの活用には、脅威の専門家との連携が必要であると言えます。

■トレンドマイクロのソリューション

トレンドマイクロでは、AIと専門家による手動の特徴設計の両方を採用する多層ソリューションのアプローチを展開しています。特に「Trend Micro™ XDR」では、メール、ネットワーク、エンドポイント、およびサーバ全体で収集されたアクティビティデータに専門家の分析を適用することでこれを実現し、相関性のある実用的なアラートを生成します。XDRは、グローバルな脅威のインテリジェンスと継続的に更新される専門家による検出ルールを組み合わせて、分析モデルの能力を最大化します。

さらに、XDR はセキュリティ層を越えた一連のイベント全体の攻撃中心の視点に必要な完全な背景を取得する調査用の単一プラットフォームを提供します。また、XDR は根本原因分析（RCA）を実行して、実行プロファイルの確認や影響範囲の特定を行い、単一の場所から対応することも可能にします。

参考記事：

「Diving Into End-to-End Deep Learning for Cybersecurity」
by Spark Tsao (Data Scientist), Trend Micro

記事構成：岡本　勝之（セキュリティエバンジェリスト）

翻訳：下舘紗耶加（Core Technology Marketing, Trend Micro™ Research

タグ

サイバーセキュリティにおける深層学習（ディープラーニング）の活用は十分か？

■マルウェアを検出するソリューションでエンドツーエンドの深層学習を活用する

■エンドツーエンドの深層学習モデルの検出率を測定する

執筆者

TrendAI Vision One™ - Proactive Security Starts Here.

リソース

サポート

会社概要

東京本社