Antes de gerar a resposta, o sistema recupera contexto relevante, o que tende a aumentar factualidade e reduzir alucinações.
O que observar na prática
Em sistemas RAG, a qualidade da resposta costuma depender menos do modelo em si do que do desenho da camada de recuperação. Se chunking, embeddings ou critérios de busca estiverem frouxos, a resposta pode parecer polida enquanto a base continua fraca.
Na prática, costuma funcionar melhor tratar isso como um problema de qualidade do retrieval, e não apenas como um problema do LLM.
Nota prática
RAG (Retrieval-Augmented Generation) costuma aparecer em contextos ligados a rag, llm, retrieval, ai. Na prática, ajuda saber não só a definição do termo, mas também o que ele está tentando nomear de forma curta em uma conversa ou em um documento.
Termos próximos se sobrepõem com facilidade e deixam a explicação vaga. Por isso, vale manter mais concreto qual é o alvo, qual é o papel do termo e em que situação ele costuma aparecer.
hsb.horse