Q4.AIの出力フィルタリングは、何をブロック・マスクすべきですか?
回答
個人情報・認証情報・内部限定用語・禁止トピックの漏えいを、ルールベースとモデルベースの両方で検知し、ブロックかマスクか人レビューかを業務ごとに決めます。
出力フィルタは精度向上ではなく、漏えいとコンプライアンス違反の最後の砦です。クレジットカード番号、マイナンバー、APIキー、未公開の製品コード名など、パターンが決まっているものは正規表現やDLP連携が有効です。一方、文脈依存の機密(顧客交渉条件など)は分類器や二次モデルでスコアリングし、閾値以上は人に回します。フィルタに引っかかった件数・誤検知率をダッシュボード化し、業務側と月次でチューニングしないと、現場がフィルタを迂回します。
- ●ブロック: 社外送信不可なカテゴリの即時停止
- ●マスク: ログ・UI表示での部分伏せ
- ●エスカレーション: グレーゾーンは人レビューキューへ