RAG(Retrieval-Augmented Generation)は、LLMの生成処理に外部情報の検索を組み合わせる技術。
日本語では「検索拡張生成」「取得拡張生成」と呼ばれることがある。読みは「ラグ」。
何をする技術か
LLMに質問を投げる前後で、検索システムから関連情報を取得し、その情報を文脈として渡して回答を生成する。
基本フロー:
- ユーザー入力を受け取る
- 関連ドキュメントを検索して取得する
- 取得結果をプロンプトへ追加する
- LLMが回答を生成する
期待できる効果
- モデル学習時点より新しい情報を回答に反映しやすい
- 回答の根拠を出典として示しやすい
- 事実に基づかない出力(ハルシネーション)を抑制しやすい
注意点
- 検索精度が低いと、回答品質も下がる
- チャンク分割や埋め込み設計で性能差が出る
- 検索結果をそのまま信頼せず、最終的な検証は別途必要
hsb.horse