🔍 RAG技术最新进展
1. Graph RAG — 知识图谱增强检索
微软开源的GraphRAG将知识图谱引入RAG流程,通过对文档自动抽取实体和关系构建图谱,实现全局语义理解和多跳推理。相比传统RAG,GraphRAG在摘要生成、跨文档问答等任务上提升显著。
GraphRAG 知识图谱 微软
2. Agentic RAG — 智能体驱动检索
Agentic RAG将AI Agent的自主决策能力融入检索流程。Agent自主判断是否需要检索、选择检索策略、评估结果质量并决定是否重试或改写查询。典型框架包括LangGraph Agentic RAG、LlamaIndex Agent。
核心能力:自适应查询路由、多源检索融合、检索结果自我验证、工具调用增强检索。
Agentic RAG 自主检索
3. 多模态RAG (MM-RAG)
2026年多模态RAG成为热点:支持同时检索文本、图像、表格、音频等多模态数据。ColPali、ColQwen等视觉检索模型可直接从文档截图/PDF中检索,无需OCR预处理,大幅提升复杂文档检索效果。
多模态RAG ColPali
4. 混合检索与精排进化
BM25 + 稠密向量 + 稀疏向量的混合检索成为标配。Cross-encoder重排序模型(如BGE-Reranker v2、Cohere Rerank 3.5)显著提升检索精度。Late Chunking、Contextual Retrieval等新技术优化分块策略。
混合检索 ReRanker
5. 向量数据库新格局
2026年向量数据库市场持续演进:Milvus 3.0支持GPU加速索引,Pinecone Serverless降低运维成本,Weaviate 2.0强化多模态支持,pgvector在PostgreSQL生态中快速普及。
选型建议:百亿级用Milvus,快速原型用Pinecone Serverless,PostgreSQL用户用pgvector。
向量数据库 Milvus Pinecone