跳转至

RAG

1. 什么是 RAG?

RAG = 检索 + 生成(Retrieval-Augmented Generation) 简单说,就是 先找资料,再回答问题

比方说: 你问我:“世界上最高的山是哪座?”

  • 如果我是普通生成模型,我可能只靠记忆回答,但记忆可能不准确或者过时。
  • RAG 模型会先去查书、查数据库找到最新的资料,然后基于这些资料生成答案。

2. 知识库是什么?

知识库就像一个大仓库,里面放着各种文档、资料、FAQ、手册等信息。 RAG 的关键是:它 先从知识库里找到最相关的内容,然后用这些内容来回答问题。


3. RAG 怎么工作?

  1. 你问问题 → “哪个城市最少下雨?”
  2. 检索阶段 → 系统在知识库里找相关资料,比如气象统计表。
  3. 生成阶段 → 模型把找到的资料组合,生成一句准确的回答。

比方说,知识库里有一份表说“拉萨一年下雨天最少”,模型就会回答:“拉萨一年下雨天最少。”


4. 为什么用 RAG?

  • 不容易“胡说八道”,答案更可靠
  • 知识库更新了,模型不用重新训练就能回答最新信息
  • 能回答更专业的问题,因为可以查专业文档