Q1.AI活用のためのデータ準備(Data Readiness)とは、具体的に何を整えることですか?
回答
「必要なデータがどこにあるか分かる」「品質と鮮度が担保されている」「権限と機密区分が付いている」の3点が土台です。モデル選定より先に、ユースケース単位で参照すべきデータセットを定義するのが近道です。
Data Readinessは、大規模なデータレイク構築と同義ではありません。まずAIに答えさせたい業務ごとに、参照元(規程、マニュアル、チケット、マスタなど)を列挙し、正本(Single Source of Truth)と更新責任者を決めます。次に、欠損・重複・矛盾の有無、最終更新日、個人情報の有無を確認します。PDFやメールに埋もれた非構造データは、検索可能な形式への変換計画も含めて整理します。準備が不十分なままRAGを組むと、検索精度の問題ではなく「そもそも参照すべき情報がインデックスにない」状態になり、改善コストが膨らみます。
- ●ユースケース別に必要データと正本を定義
- ●品質: 欠損率、重複、版の混在を可視化
- ●ガバナンス: 機密区分・保持期間・更新オーナー