logo hsb.horse
← 用語集一覧に戻る

Glossary

RAG(Retrieval-Augmented Generation)

RAGは、LLMの生成に外部検索を組み合わせる手法。最新情報の取り込みと回答根拠の明確化に有効で、ハルシネーション抑制にもつながる。

公開日: 更新日:

RAG(Retrieval-Augmented Generation)は、LLMの生成処理に外部情報の検索を組み合わせる技術。
日本語では「検索拡張生成」「取得拡張生成」と呼ばれることがある。読みは「ラグ」。

何をする技術か

LLMに質問を投げる前後で、検索システムから関連情報を取得し、その情報を文脈として渡して回答を生成する。

基本フロー:

  1. ユーザー入力を受け取る
  2. 関連ドキュメントを検索して取得する
  3. 取得結果をプロンプトへ追加する
  4. LLMが回答を生成する

期待できる効果

  • モデル学習時点より新しい情報を回答に反映しやすい
  • 回答の根拠を出典として示しやすい
  • 事実に基づかない出力(ハルシネーション)を抑制しやすい

注意点

  • 検索精度が低いと、回答品質も下がる
  • チャンク分割や埋め込み設計で性能差が出る
  • 検索結果をそのまま信頼せず、最終的な検証は別途必要