Q5.ナレッジ検索のメタデータ設計で、最初に付けるべき項目は?
回答
文書種別、部門・製品、版数・有効期限、機密区分、言語、更新日、オーナーが基本です。検索時のフィルタと、回答根拠の説明の両方に使える項目を優先します。
メタデータは、ベクトル類似度だけでは区別できない情報(古い版、別部門の規程、社外秘レベル)を制御するために重要です。設計時は、ユーザーが実際に絞り込む軸(「営業向け」「2024年度版」「日本語」など)と、セキュリティポリシー上必須の軸(ロール、データ分類)を洗い出します。付けすぎると入力負荷が上がり更新が止まるため、必須項目は最小限にし、自動付与(ファイルパス、Gitのコミット日、CMSのタグ)を活用します。RAG回答では、引用元のタイトル・版・更新日をユーザーに見せられるよう、メタデータスキーマをUI/APIと揃えておくと信頼性が上がります。
- ●必須候補: 種別、版、有効期限、機密区分、更新日
- ●自動付与: ソースシステムのID、パス、CMSタグ
- ●用途: 検索フィルタ+引用表示+アクセス制御