1. 核心测试维度

  • 召回率:搜索结果的相关性(Recall@K、MRR)
  • 延迟:查询响应时间(P50、P99)
  • 写入性能:数据插入和索引构建速度
  • 扩展性:数据量增长时的性能变化

2. RAG场景测试

验证向量数据库在RAG(检索增强生成)场景下的端到端表现:文档检索准确率→上下文召回质量→最终生成质量。