Q8.構造化データと非構造化データ、AIナレッジ基盤ではどう扱い分けますか?
回答
非構造化(文書・会話)はRAG向き、構造化(マスタ・トランザクション)はSQL/API参照やテキスト化したサマリを併用します。混在させず、問いの種類ごとにルートを分けると精度が安定します。
「昨年度の売上上位10社」はRAGではなく、DWやCRMへのクエリが適切です。「返品ポリシーの例外条件」は規程PDFのRAGが向きます。実務では、エージェントやオーケストレーション層で、数値・一覧系は構造化ソースへ、説明・手順系はベクトル検索へルーティングします。構造化データを無理に文書化してベクトル化すると、数値の鮮度や集計ロジックが失われます。逆に、非構造だけでは最新の在庫数などは答えられないため、データカタログで「どの問いにどの源を使うか」を定義しておくことが重要です。
- ●非構造: 文書、議事録、メール → RAG
- ●構造: マスタ、KPI、在庫 → DB/API/SQL
- ●設計: 質問タイプ別のルーティング表