Q16.ナレッジ文書の版管理(バージョンコントロール)は、どう設計すればよいですか?
回答
正本システム(Git、CMS、規程管理)で版を管理し、インデックスには source_version を必ず持たせ、旧版は検索対象から外すかアーカイブ扱いにします。インデックスと正本の版ズレを検知する仕組みが必要です。
版管理がないと、同一タイトルで内容が異なるチャンクが混在し、AIが矛盾した回答をします。Git管理のMarkdown、CMSの公開版、PDFの改定番号など、ソースごとに版IDを定義し、パイプラインは「新版 upsert + 旧版 delete」を原子操作に近づけます。ユーザーには、回答引用に版と更新日を表示し、最新版へのリンクを出します。規程の過去版を意図的に残す場合は、effective_date メタデータで有効期間を切り、質問の時点に合う版を選ぶロジックが必要です。再インデックス失敗時に旧インデックスへロールバックできるよう、デプロイ単位を版単位で記録します。
- ●正本: Git/CMS/規程DBで版を一意に
- ●インデックス: source_version、有効期間メタデータ
- ●運用: 新版反映と旧版削除の自動化、ロールバック