大規模言語モデル（LLM）は、現代のアプリケーションにとってますます不可欠な存在となっており、そのセキュリティ確保はこれまで以上に重要です。これまでの記事では、主にコード実行、データ送出、データベースアクセスといった領域において、AIエージェントを脅かす新たな脆弱性について取り上げてきました。連載の最終回となる本稿では、これらの脅威がもたらす課題に先手を打つための方法を検討し、これらのシステムを保護するために必要な堅牢で多層的な戦略の必要性について述べます。

コード実行の脆弱性に対処する

コード実行の脆弱性の核心的な課題は、LLMが意図せず望ましくない動作を実行してしまう制御不能な可能性にあります。AIエージェントに幅広いシステムアクセス権を与えることで、攻撃者は意図しないコード実行を誘発する可能性があります。これに対処するには、根本的な部分で「制御」へのシフトが必要です。効果的なサンドボックス化により、実行できるプロセスやアクセスできるファイルシステム領域を制限することが基本となり、不正なアクセスを防ぎます。さらに、CPUやメモリの使用を制限するリソースコントロールを導入することで、安全装置として機能させることができます。これらの手法は、単にセキュリティ侵害の可能性を減らすだけでなく、トリガー可能な脆弱性が引き起こす意図しない動作からシステムを積極的に防御します。

コード実行の脆弱性の中心にあるのは、LLMに過剰な権限や制御されないアクセス権を与えることで、攻撃者が不正な動作を実行させるリスクです。ここでの課題は、正当な動作を妨げることなく、悪意のあるコマンドが実行される可能性を最小限に抑えることです。有効な手法の一つは、厳格なサンドボックス化を適用することです。プロセスを隔離し、ファイルシステムとのやり取りを制限することで、攻撃者が利用できる経路を削減します。加えて、メモリ、CPU使用率、実行時間の上限を設けることで、万一侵害が発生したとしても、その影響範囲を最小限に抑えることが可能です。さらに、異常な動作を早期に検知できるように継続的な監視を行うことで、防御体制をより強固にできます。

この種の脆弱性に対処するため、以下のようなプロアクティブなセキュリティ対策を推奨します。

システム機能の制限:
- バックグラウンドプロセスを無効化するか、特定の操作のみに制限します。
- ファイルシステムアクセスに対して、より厳格な権限管理を適用します。
アクティビティの監視:
- アカウントのアクティビティ、失敗、および異常な動作を追跡し、潜在的な脅威を特定します。
リソース制限:
- サンドボックスのリソース使用量（メモリ、CPU、実行時間など）に制限を設け、不正利用やリソース枯渇を防ぎます。
インターネットアクセス制御:
- サンドボックス内からの外部アクセスを制御し、攻撃対象領域を縮小します。
悪意ある動作の監視:
- ファイル操作や改ざんなどの不審な動作を検知するために、動作解析ツールを活用します。
入力検証:
- サンドボックスへのデータ送受信の双方向で、パイプライン内のデータを検証・サニタイズします。
スキーマの適用:
- データを次の処理に渡す前に、すべての出力が期待されるフォーマットに準拠していることを確認します。

データ送出の脆弱性に対処する

データ送出の脆弱性は、機密情報や重要なデータがシステム外へ意図せず流出してしまうリスクに関わっています。通常の入力に紛れた巧妙なプロンプトや隠しインジェクションは、一見して判別がつきにくく、組織に深刻な損害を与える可能性があります。これを防ぐためには、潜在的な脅威を隔離し、無害に見えるデータに潜む悪意ある指示を解読する二重のアプローチが求められます。信頼できるエンティティとそうでないものの間でネットワークレベルの隔離を実施することで、最初の防御線を築くことができます。一方、検証済みの入力チェックにより、隠れたプロンプトインジェクションを無力化できます。さらに重要なのは、光学文字認識やコンテキスト行動分析といった高度な診断ツールを活用して、漏洩活動の兆候を早期に特定し、本格的な侵害に至る前に無効化することです。

データ送出の脆弱性は、プロンプトを巧妙に仕込んでデータを送出させる攻撃者の手口から生じることが多くあります。ここで重要なのは、システムが外部の入力とやり取りする際に、内部プロセスと同様の厳格な管理を行う必要があるという点です。効果的な戦略の一つとしては、LLMを信頼できない外部ソースからネットワーク分離し、厳格なアクセス制御を施すことで、不正なデータフローを防ぐ強固な障壁を築くことが挙げられます。これに加えて、ペイロード解析や自動コンテンツモデレーションといった高度なインスペクション技術を活用し、受信データ内の隠れた脅威を検出します。これらの手法を包括的なログ管理や行動監視と組み合わせることで、データ送出の兆候を早期に発見し、重大な被害が発生する前に対処することができます。

間接的なプロンプトインジェクションのリスクに対処するためには、多角的な戦略が不可欠です。主なプロアクティブなセキュリティ対策として、以下のような手法が挙げられます。

アクセス制御と隔離
- ネットワークレベルの制御を用いて、信頼できないURLへのアクセスをブロックします。
ペイロード検査
- アップロードデータを高度なフィルタリングでスキャンし、隠れた命令を検出します。
コンテンツモデレーションとプロンプトサニタイズ
- モデレーションパイプラインや脅威検知モデルを活用して、埋め込まれた命令を検出し無効化します。
- 入力データをサニタイズし、悪意あるプロンプトを除去または隔離します。
高度なログ管理とモニタリング
- やり取りのログを記録し、LLMの出力パターンにおける異常を監視して脅威を特定します。

データベースアクセスの脆弱性に対処する

データベースアクセスの脆弱性は、特にプロンプトインジェクションが関与するシナリオで、LLMが無害な命令と悪意ある命令を区別するのが難しいという特性を突くものです。ここでの課題は、重要なデータストアに不正なコマンドが到達するのを防ぐことにあります。この問題に取り組むには、従来のサニタイズ手法だけでは不十分です。堅牢な防御には、機密性の高い操作には確認ステップを必須とする検証プロトコルや、各コマンドの目的を評価するインテントベースのフィルタリングといった多層的な戦略が必要です。さらに、LLMとデータベースの間に厳格な境界を設けることで、あらかじめ定義された安全な操作のみが許可されるようになり、リスクを一層低減できます。こうしたプロアクティブな検証と厳格なアクセス制御を組み合わせることで、潜在的なインジェクション攻撃に対して包括的な防御壁を築けます。

この種の脆弱性、特にSQL生成の脆弱性やベクターストアの汚染問題に対処するのは、根本的な原因として、プロンプトインジェクションに対するLLMの脆弱性や悪意のある意図を確実に見分けられないことがあるため、本質的に難しい面があります。プロンプトインジェクション技術が進化し続ける中で、リスクを軽減するためには多層的なアプローチが不可欠です。主なプロアクティブなセキュリティ対策としては、以下が挙げられます。

従来のデータサニタイズとフィルタリング
- ユーザ入力をクリーンアップ・フィルタリングする従来の技術は有効ではあるものの、特に高度化・難読化されたプロンプトインジェクション攻撃に対しては、その適用範囲に限界があります。
確認プロンプト
- 重要な操作に対して中間確認プロンプトを導入することで、LLMが意図しないコマンドを実行したり、不正なデータにアクセスしたりするのを防ぐことができます。
インテント分類
- インテント分類モデルを使用して、悪意のある入力を検出しブロックすることは、特に保存型プロンプトインジェクション攻撃に有効です。こうしたモデルにより、LLMやデータベースに届く前に、潜在的に有害または不適切な入力を特定できます。
LLMからデータベースへのアクセス制御
- LLMとデータベース間に厳格なアクセス制御を適用することで、LLMがあらかじめ定義された範囲内でしかデータにアクセス・変更できないようにし、SQL生成の脆弱性を軽減できます。これにより、不正なクエリやデータの改ざんを防止できます。

結論

現在のダイナミックなデジタル環境において、AIエージェントのセキュリティ確保はもはや選択肢ではなく、必須事項です。コード実行、データ漏えい、データベースアクセスに関する進化する脅威は、プロアクティブかつ多層的な防御戦略が重要であることを改めて示しています。安全なサンドボックス化や厳格なリソース管理を組み込むことで、不正なコード実行のリスクを低減できます。同様に、高度なペイロード分析や厳格なネットワーク分離により、微細なデータ漏えいからシステムを守ることができます。さらに、基本的なサニタイズを超えて、検証プロトコルやインテントベースのフィルタリングを導入することで、信頼できる事前承認済みの操作のみがデータベースとやり取りできるようになります。

攻撃者の手口が進化を続ける中で、防御策も進化させる必要があります。こうした堅牢なセキュリティ対策を採用することで、AI駆動のシステムを守るだけでなく、今後のイノベーションのための強靭な基盤を築くことができます。今後も継続的な監視、適応的な戦略、厳格なセキュリティプロトコルなど、プロアクティブなセキュリティ対策を推進し、これからの課題に対応していきましょう。

トレンドマイクロのソリューション

Trend Vision Oneプラットフォームを活用すれば、AIスタック全体のセキュリティを確保できます。

データ保護:
- Cloud Security: Data Security Posture Management (DSPM)
AIモデル:
- Zero Trust Secure Access: AI Service Access
マイクロサービス:
- Cloud Security: Container Security
- Cloud Security: Code Security
AIインフラストラクチャ:
ネットワーク:
- Network Security: Network Detection and Response (NDR)
- TippingPoint (Threat Protection System)
ユーザとローカルAIアプリ:

シリーズの他の回については、以下からお読みください。

パート1: AIエージェントの脆弱性を明らかにする: AIエージェントにおける主要なセキュリティリスク（プロンプトインジェクションや不正なコード実行など）を紹介し、データ送出、データベースの不正利用、緩和策など、今後の議論の構成について概要を示します。
パート2: コード実行の脆弱性: 攻撃者がLLMベースのサービスの脆弱性を悪用して不正なコードを実行し、サンドボックスの制限を回避し、エラーハンドリングの欠陥を突くことで、データ送出、不正なデータ転送、実行環境内での持続的なアクセスを実現する手法について詳しく解説します。
パート3: データ送出: 攻撃者がマルチモーダルLLM（GPT-4oなど）を利用し、間接的なプロンプトインジェクションを仕掛け、無害に見えるペイロードを通じて機密データを送出させる方法を取り上げます。これにより、ウェブページ、画像、ドキュメントなどに隠された命令を埋め込み、AIエージェントを騙してユーザのやり取りやアップロードされたファイル、チャットの履歴から機密情報を送出させるゼロクリック攻撃が可能になります。
パート4: データベースアクセスの脆弱性: 攻撃者がSQLインジェクション、保存型プロンプトインジェクション、ベクターストア汚染を通じて、LLMと統合されたデータベースシステムを悪用し、制限されたデータを抽出したり、認証を回避したりする手口を解説します。プロンプト操作を用いてクエリ結果を操作したり、機密情報を取得したり、将来的なクエリに影響を与える持続的な攻撃コードを挿入したりする可能性も指摘しています。

参考記事：

Unveiling AI Agent Vulnerabilities Part V: Securing LLM Services
By Sean Park (Principal Threat Researcher)

翻訳：与那城務（Platform Marketing, Trend Micro™ Research）

タグ

AIエージェントと脆弱性 PART 5：LLMサービスのセキュリティ確保

目次

コード実行の脆弱性に対処する

データ送出の脆弱性に対処する

データベースアクセスの脆弱性に対処する

結論

トレンドマイクロのソリューション

参考記事：

執筆者

Trend Vision One™ - Proactive Security Starts Here.

リソース

サポート

会社概要

東京本社

Trend Vision One™ - Proactive Security Starts Here.

リソース

サポート

会社概要

東京本社

The Americas

Asia Pacific

Europe, Middle East & Africa