📋 LLM推理基础设施测试

1. LLM推理架构

GPU集群→推理引擎（vLLM/TGI/Triton）→API网关→应用层。关键指标：TTFT（首Token时间）、TPOT（每个Token时间）、吞吐量、显存利用率。

📊 数据与AI基础设施知识体系 · 持续建设