Q15.AI向けのレッドチーミング(攻撃演習)は、何を対象にしますか?
回答
プロンプトインジェクション、権限昇格、ツール悪用、データ漏えい、出力フィルタ迂回を、本番に近い設定で定期的に試します。結果はリスク台帳と改善バックログに載せます。
レッドチームは「モデルの賢さテスト」ではなく、統制の穴探しです。社内文書に埋めた指示、メール経由の間接プロンプト、他部門データへの検索、過剰なツール引数などをシナリオ化します。ブルーチーム(防御側)と分け、発見事項の重大度・再現手順・修正期限を記録します。年1回の外部診断と、リリース前の自動スキャン(プロンプトテンプレート、依存ライブラリ)を組み合わせるとコスト対効果が良いです。経営には「攻撃成功件数」より「修正済み/未修正の高リスク」を報告します。
- ●シナリオ: インジェクション、漏えい、誤操作、サプライチェーン
- ●頻度: 重大変更時+年次の本番相当演習
- ●成果物: 再現手順・CVSS相当・修正チケット