🧠 Agentic RAG

🧠

Agentic RAG —— 让检索拥有"思考"能力

Agentic RAG 是 RAG(检索增强生成)的下一代演进方向。它赋予 Agent 自主规划检索策略的能力——不再简单地"查询-返回",而是像研究人员一样分析问题、拆解子问题、迭代检索并综合信息。

📈 从传统 RAG 到 Agentic RAG 的演进

RAG 的演进经历了三个阶段,从简单的单次检索到智能 Agent 自主规划的多轮动态检索:

1.0

💡 朴素 RAG

用户提问 → 向量检索 → 拼接上下文 → LLM 生成。
适合简单的事实型问答,但对复杂问题和多步推理无能为力。

2.0

🔧 高级 RAG

引入查询重写、混合检索、重排序、摘要压缩等优化手段。
提升了检索质量,但检索策略仍是静态的。

3.0

🧠 Agentic RAG

Agent 自主规划检索策略:分解问题 → 多轮检索 → 验证信息 → 综合回答。
检索变成 Agent 的一个"思考-行动"循环。

阶段检索方式推理能力适用场景典型技术
朴素 RAG (1.0) 单次向量检索 无推理,直接检索 简单 FAQ、文档查询 LangChain RAG Chain
高级 RAG (2.0) 混合检索 + 重排序 + 压缩 查询优化,静态策略 企业知识库、客服系统 HyDE、LLM-as-Reranker
Agentic RAG (3.0) Agent 自主规划的多轮动态检索 自主推理,动态决策 研究分析、多源综合、复杂推理 Self-RAG、CRAG、ReAct + RAG

🎯 动态检索策略

Agentic RAG 的核心在于 Agent 能够根据问题复杂度动态选择检索策略。以下是三种主要的动态检索模式:

🔍 自问自答(Self-Ask)

Agent 将复杂问题分解为多个子问题,逐一检索并逐步构建答案

  • 识别问题中的多个子问题
  • 对每个子问题独立检索
  • 综合各子答案形成最终回答
  • 代表方法:Self-Ask、Decomposed Prompting

🔗 多跳检索(Multi-hop)

Agent 根据上一轮检索结果动态决定下一轮检索方向

  • 首次检索获取初步信息
  • 分析信息中的线索,生成新查询
  • 迭代直到信息足够回答问题
  • 代表方法:IRCoT、Iter-RetGen

🔄 迭代反思(Iterative)

Agent 在每次检索后反思信息质量,决定是否需要重新检索或补充信息

  • 检索后评估信息相关性
  • 如不满意,调整查询策略重试
  • 可结合工具调用补充信息
  • 代表方法:Self-RAG、CRAG、Corrective RAG

🔧 工具增强检索

Agentic RAG 的一个重要特性是能够"按需调用工具"来增强检索能力。这不仅限于向量检索,还包括:

  • 📊 数据库查询:当向量检索不够精确时,Agent 可以生成 SQL 查询直接获取结构化数据
  • 🌐 Web 搜索:当本地知识库不包含所需信息时,Agent 自动执行网络搜索
  • 📄 文档解析:Agent 可以调用 PDF/Office 解析工具提取特定章节内容
  • 🧮 计算工具:当检索到的数据需要进一步计算时,Agent 调用代码解释器
  • 🗺️ 知识图谱查询:对于关系型问题,Agent 执行图数据库查询
💡 Agentic RAG vs 传统 RAG 对比
对比维度传统 RAGAgentic RAG
检索次数1 次(单轮)N 次(多轮动态)
检索策略静态(固定 pipeline)动态(Agent 自主规划)
问题拆解不支持自动拆解复杂问题
信息验证检索后反思,纠正错误
工具调用不支持按需调用 SQL/搜索/计算工具
适用问题类型简单事实型复杂推理、多源综合
延迟低(~1-2s)中-高(~3-10s+)
成本较高(多次 LLM 调用)
准确率(复杂问题)60-70%80-90%+

🏗️ Agentic RAG 架构

一个典型的 Agentic RAG 系统包含以下核心组件:

  • 🧠 Agent 核心:基于 ReAct 或 Plan-and-Execute 模式,负责推理和决策
  • 📚 多源检索器:向量检索、关键词检索、知识图谱、结构化查询的统一接口
  • 🔧 工具集:Web 搜索、SQL 查询、代码执行、文档解析等增强工具
  • 📊 信息综合器:将多轮检索结果去重、融合、排序,形成结构化上下文
  • ✅ 验证器:检查信息的完整性、一致性和时效性,触发补充检索

🔮 展望

Agentic RAG 代表了知识检索系统的未来方向。随着推理模型能力的提升,Agentic RAG 将在以下场景发挥更大价值:

  • 研究分析:自动化的文献综述、竞争分析、技术调研
  • 法律/合规:跨法规、判例的复杂法律推理
  • 金融分析:多源数据融合的投资研究报告
  • 医疗诊断:跨文献、病历、指南的综合诊断辅助