Le modèle récupère un contexte pertinent avant génération, ce qui peut renforcer la factualité et réduire les hallucinations.
Ce qu’il faut regarder en pratique
Dans un système RAG, la qualité de la réponse dépend souvent moins du modèle lui-même que de la manière dont la récupération est conçue. Si le découpage, les embeddings ou les critères de recherche sont approximatifs, la réponse peut sembler propre alors que son ancrage reste faible.
En pratique, il est souvent plus utile de traiter cela comme un problème de qualité du retrieval que comme un problème du LLM.
Note pratique
RAG (Retrieval-Augmented Generation) apparaît souvent dans des contextes liés à rag, llm, retrieval, ai. En pratique, il est utile de connaître non seulement la définition du terme, mais aussi ce qu’il sert à nommer rapidement dans une discussion ou dans un document.
Les mots voisins se recouvrent facilement et rendent l’explication floue. Il est donc plus simple de garder en tête l’objet visé, le rôle du terme et la situation typique où il apparaît.
hsb.horse