🧠 Agentic RAG
🧠
Agentic RAG —— 让检索拥有"思考"能力
Agentic RAG 是 RAG(检索增强生成)的下一代演进方向。它赋予 Agent 自主规划检索策略的能力——不再简单地"查询-返回",而是像研究人员一样分析问题、拆解子问题、迭代检索并综合信息。
📈 从传统 RAG 到 Agentic RAG 的演进
RAG 的演进经历了三个阶段,从简单的单次检索到智能 Agent 自主规划的多轮动态检索:
1.0
💡 朴素 RAG
用户提问 → 向量检索 → 拼接上下文 → LLM 生成。
适合简单的事实型问答,但对复杂问题和多步推理无能为力。
→
2.0
🔧 高级 RAG
引入查询重写、混合检索、重排序、摘要压缩等优化手段。
提升了检索质量,但检索策略仍是静态的。
→
3.0
🧠 Agentic RAG
Agent 自主规划检索策略:分解问题 → 多轮检索 → 验证信息 → 综合回答。
检索变成 Agent 的一个"思考-行动"循环。
| 阶段 | 检索方式 | 推理能力 | 适用场景 | 典型技术 |
|---|---|---|---|---|
| 朴素 RAG (1.0) | 单次向量检索 | 无推理,直接检索 | 简单 FAQ、文档查询 | LangChain RAG Chain |
| 高级 RAG (2.0) | 混合检索 + 重排序 + 压缩 | 查询优化,静态策略 | 企业知识库、客服系统 | HyDE、LLM-as-Reranker |
| Agentic RAG (3.0) | Agent 自主规划的多轮动态检索 | 自主推理,动态决策 | 研究分析、多源综合、复杂推理 | Self-RAG、CRAG、ReAct + RAG |
🎯 动态检索策略
Agentic RAG 的核心在于 Agent 能够根据问题复杂度动态选择检索策略。以下是三种主要的动态检索模式:
🔍 自问自答(Self-Ask)
Agent 将复杂问题分解为多个子问题,逐一检索并逐步构建答案
- 识别问题中的多个子问题
- 对每个子问题独立检索
- 综合各子答案形成最终回答
- 代表方法:Self-Ask、Decomposed Prompting
🔗 多跳检索(Multi-hop)
Agent 根据上一轮检索结果动态决定下一轮检索方向
- 首次检索获取初步信息
- 分析信息中的线索,生成新查询
- 迭代直到信息足够回答问题
- 代表方法:IRCoT、Iter-RetGen
🔄 迭代反思(Iterative)
Agent 在每次检索后反思信息质量,决定是否需要重新检索或补充信息
- 检索后评估信息相关性
- 如不满意,调整查询策略重试
- 可结合工具调用补充信息
- 代表方法:Self-RAG、CRAG、Corrective RAG
🔧 工具增强检索
Agentic RAG 的一个重要特性是能够"按需调用工具"来增强检索能力。这不仅限于向量检索,还包括:
- 📊 数据库查询:当向量检索不够精确时,Agent 可以生成 SQL 查询直接获取结构化数据
- 🌐 Web 搜索:当本地知识库不包含所需信息时,Agent 自动执行网络搜索
- 📄 文档解析:Agent 可以调用 PDF/Office 解析工具提取特定章节内容
- 🧮 计算工具:当检索到的数据需要进一步计算时,Agent 调用代码解释器
- 🗺️ 知识图谱查询:对于关系型问题,Agent 执行图数据库查询
💡 Agentic RAG vs 传统 RAG 对比
| 对比维度 | 传统 RAG | Agentic RAG |
|---|---|---|
| 检索次数 | 1 次(单轮) | N 次(多轮动态) |
| 检索策略 | 静态(固定 pipeline) | 动态(Agent 自主规划) |
| 问题拆解 | 不支持 | 自动拆解复杂问题 |
| 信息验证 | 无 | 检索后反思,纠正错误 |
| 工具调用 | 不支持 | 按需调用 SQL/搜索/计算工具 |
| 适用问题类型 | 简单事实型 | 复杂推理、多源综合 |
| 延迟 | 低(~1-2s) | 中-高(~3-10s+) |
| 成本 | 低 | 较高(多次 LLM 调用) |
| 准确率(复杂问题) | 60-70% | 80-90%+ |
🏗️ Agentic RAG 架构
一个典型的 Agentic RAG 系统包含以下核心组件:
- 🧠 Agent 核心:基于 ReAct 或 Plan-and-Execute 模式,负责推理和决策
- 📚 多源检索器:向量检索、关键词检索、知识图谱、结构化查询的统一接口
- 🔧 工具集:Web 搜索、SQL 查询、代码执行、文档解析等增强工具
- 📊 信息综合器:将多轮检索结果去重、融合、排序,形成结构化上下文
- ✅ 验证器:检查信息的完整性、一致性和时效性,触发补充检索
🔮 展望
Agentic RAG 代表了知识检索系统的未来方向。随着推理模型能力的提升,Agentic RAG 将在以下场景发挥更大价值:
- 研究分析:自动化的文献综述、竞争分析、技术调研
- 法律/合规:跨法规、判例的复杂法律推理
- 金融分析:多源数据融合的投资研究报告
- 医疗诊断:跨文献、病历、指南的综合诊断辅助