Q2.RAGとファインチューニング、どちらを選ぶべきですか?
回答
社内ドキュメントや最新情報を参照させたい場合はRAGが適しています。モデルの振る舞いや出力形式を根本から変えたい場合はファインチューニングを検討します。多くの業務用途では、まずRAGから始めるのが現実的です。
RAG(Retrieval-Augmented Generation)は、質問に関連する文書を検索してからLLMに渡す方式です。ナレッジの更新が容易で、根拠のある回答を出しやすい一方、検索精度やチャンク設計の品質に依存します。ファインチューニングはモデルの重み自体を調整するため、特定ドメインの言い回しや分類精度を高められますが、データ準備・再学習コストが高く、知識の陳腐化にも弱いです。両者は排他的ではなく、RAGで最新情報を参照しつつ、分類や要約スタイルだけファインチューニングするハイブリッドも一般的です。判断基準は「知識の更新頻度」「根拠提示の必要性」「学習データの量と品質」です。
- ●RAG:外部ナレッジ参照、更新が容易、根拠提示に向く
- ●ファインチューニング:モデル挙動のカスタマイズ、データと運用コストが大きい
- ●まずRAGで試し、不足分をファインチューニングやプロンプト設計で補う