RAG vs 微调:企业知识库该选哪个
这是企业上 AI 之前最常被卡住的一个技术决策。给一个直球答案:90% 的企业场景,从 RAG 起步是正确的。微调是优化问题,不是起点。下面解释为什么。
一、两种路径的核心差别
| 维度 | RAG(检索增强生成) | 微调(Fine-tuning) |
|---|---|---|
| 知识承载 | 外置向量库 + 实时检索 | 烧进模型权重 |
| 更新成本 | 新增文档即可 | 重新训练,慢且贵 |
| 引用追溯 | 每条答案可标注来源 | 不可追溯 |
| 合规风险 | 数据可分级权限 | 权重一旦泄露即数据泄露 |
| 初期成本 | 低 | 高(数据 + 算力) |
| 擅长场景 | 事实问答、文档检索 | 风格 / 格式 / 行业语气 |
二、什么时候用 RAG
- 知识更新频繁(产品文档每周改、政策每月调)
- 需要可追溯引用(合规、客服、投研都要)
- 知识量大(GB 到 TB 级)
- 数据有访问权限边界(HR 看 HR 的、销售看销售的)
三、什么时候考虑微调
- 需要稳定的输出风格(如固定的研报格式、合同模板语言)
- 有大量高质量人工标注数据(万条以上)
- RAG 已经做到位,瓶颈在于「答得对但说得不像专家」
- 对延迟敏感(微调过的小模型推理更快)
四、企业实操建议(艾景特方案)
- 先 RAG,把知识结构化和向量化做扎实
- 跑 4–8 周观察盲点:是「检索召回不够」还是「输出风格不对」
- 如果是召回问题 → 优化分块、Embedding 模型、重排序
- 如果是风格问题 → 在 RAG 之上做 LoRA 轻量微调
- 极少数情况才需要全量微调