RAG(检索增强生成)
打个比方:有两类学生参加考试:
- 学生 A 只靠脑子里的记忆答题。碰到自己没学过的新知识点,只能瞎编——这就是普通 AI(没有 RAG)。
- 学生 B 碰到不确定的题,先翻开课本查一下相关章节,然后基于课本内容答题。回答准确得多,而且如果课本是最新版,答案也是最新的——这就是 RAG(开卷考试)。
RAG 怎么实现"开卷考试"
- 先把课本变成索引卡片:把公司文档、知识库切成小段,每段做一个"语义标签"(Embedding),存进卡片柜。
- 你提问时:不直接把问题丢给 AI,而是先去卡片柜里找"哪些卡片和这个问题最相关"。
- 翻出相关的卡片:把相关卡片和你的问题一起递给 AI,说"基于这些资料回答"。
- AI 基于真实资料作答:不会瞎编,因为有卡片上清清楚楚写着呢。
什么时候用 RAG
- 公司内部问答:员工手册今天改了,明天 AI 就能答出最新的规定——因为每次回答前都会重新翻卡片。
- 法律顾问:法规更新后,只要更新知识库,AI 就能给你最新法条。
- 客服机器人:产品文档更新后,回答立刻变。
RAG vs Fine-tuning:抄笔记 vs 背下来
RAG 是让你翻笔记本找答案——笔记本更新后答案自动更新。Fine-tuning 是让你把整本书背下来——书改版了你就得重新背。对于信息经常变动的场景(公司制度、产品文档、法律法规),RAG 远比 Fine-tuning 合适。