AI测试是一项全新的技术领域,其技能要求、工作方法和质量判断标准与传统软件测试存在本质差异。对银行而言,建设一支专业化的AI测试团队,不是在现有测试团队基础上"加一块AI的事",而是需要在组织架构、人才结构、能力体系和工作流程上进行系统性规划。本章从团队定位、组建模式、角色定义、规模估算、能力建设路径和协作机制六个维度,为某银行AI测试团队建设提供系统性指导。
结合某银行「某银行AI建设工程」的三阶段实施路径,测试团队需要在2026年完成AI测试基础能力的组织建设,确保后续各业务场景的AI系统上线时有专业团队负责质量验收。
1. 为什么需要专门的AI测试团队
1.1 AI测试与传统测试的技能差异
AI测试与传统软件测试在测试对象、测试方法、判定标准和工具链四个维度上存在根本性差异。简单地让传统测试工程师"兼做AI测试"往往会导致测试深度不足、关键风险遗漏等问题:
| 对比维度 | 传统软件测试 | AI系统测试 | 技能要求差异 |
|---|---|---|---|
| 测试对象 | 确定性系统:输入→输出可精确预判 | 概率性系统:同一输入可能产生不同输出 | 需要理解模型推理机制、概率分布、温度参数等概念 |
| 测试方法 | 基于需求规格的用例设计,断言精确匹配 | 基于场景的评测设计,多元质量维度综合评分 | 需要掌握RAGAS、LLM-as-Judge等AI专项评测方法 |
| 判定标准 | Pass/Fail二元判断 | 多维评分(忠实性、相关性、安全性等),阈值判定 | 需要建立评分Rubric和自动化评判能力 |
| 缺陷类型 | 功能性Bug:逻辑错误、异常未处理等 | 幻觉、偏见、安全漏洞、知识盲区、Prompt注入等新型缺陷 | 需要理解AI特有的缺陷模式(如幻觉的分类与识别) |
| 测试数据 | 结构化测试数据,易于构造边界值 | 需要高质量标注数据集,覆盖长尾场景和对抗样本 | 需要数据标注、对抗样本构造、Few-shot示例设计能力 |
| 工具链 | Selenium、JMeter、Postman等成熟工具 | RAGAS、Garak、lm-eval-harness等新兴工具 | 需要快速学习新兴开源工具,具备工具集成和二次开发能力 |
由上表可见,AI测试至少在六个关键维度上需要区别于传统测试的专项能力。这些能力如果分散在传统测试团队中、由各成员业余学习,很难形成体系化的专业深度。
1.2 银行AI测试团队的特殊定位
银行的AI测试团队不仅需要具备通用的AI测试能力,还需要承担以下三个特殊定位,这些定位决定了团队的人员配置和能力要求:
- 质量守门人:银行AI系统的质量事故可能导致监管处罚、资金损失和声誉危机。AI测试团队是AI系统上线的最后一道质量关卡,必须对模型的准确性、安全性、合规性做出独立判断
- 合规验证者:金融AI面临《生成式AI服务管理办法》《个人信息保护法》《数据安全法》等多部法规约束。AI测试团队需要将监管要求转化为可执行的测试用例,并形成合规验证报告——这是传统测试团队不具备的能力
- 能力建设者:银行AI测试尚处于行业早期,没有成熟的最佳实践可以照搬。AI测试团队需要在实践中探索和沉淀适合某银行的方法论、工具集和标准规范,成为组织AI测试能力的孵化器
- 风险预警者:AI系统的质量风险具有"隐蔽性"和"滞后性"——模型漂移、数据分布变化等风险不会立即表现为故障,但会持续侵蚀系统质量。AI测试团队需要建立持续监控和风险预警机制
2. 团队组建模式
2.1 三种模式对比
根据行业调研和对标分析,目前银行AI测试团队的组建主要有三种模式。每种模式在资源投入、能力深度、协作效率等方面各有优劣,需要结合某银行实际情况进行选择:
| 对比维度 | 模式A:专业AI测试团队 | 模式B:嵌入式AI测试能力 | 模式C:混合模式(推荐) |
|---|---|---|---|
| 组织形态 | 独立建制的AI测试团队,直接向测试处负责人汇报 | 在各业务测试组中培养AI测试专员,不设独立团队 | 设立AI测试核心小组(3-5人)+ 各业务线AI测试联络人 |
| 适用场景 | AI项目密集、系统复杂度高、需要统一质量标准的银行 | AI项目少且分散、各业务线测试需求差异大的情况 | AI项目数量适中(3-8个),需要平衡专业深度和业务覆盖 |
| 优势 | 专业深度强、方法论统一、工具链标准化、人才集中培养 | 业务理解深、响应速度快、人力成本灵活 | 兼顾专业性与业务覆盖,核心能力集中建设,业务适配分散执行 |
| 劣势 | 初期投入大、与业务测试团队的协作成本高、可能形成"孤岛" | 专业深度不足、测试标准不一致、知识难以沉淀和复用 | 需要精心设计协作机制,核心小组与联络人之间的信息同步成本 |
| 建设周期 | 6-12个月(招聘+培训+工具搭建) | 3-6个月(内部培训+认证) | 4-8个月(核心组建3个月 + 联络人网络2-5个月) |
| 初始人力需求 | 5-8人 | 每业务线1-2人(兼职) | 核心3-5人 + 联络人每线0.5人(兼职折算) |
| 典型同业案例 | 某股份制银行(AI评测中心,8人团队) | 某城商行(在敏捷测试团队中嵌入AI测试角色) | 某大行(联邦式架构,详见第3节"同业实践") |
2.2 模式选择建议
结合某银行某银行AI建设工程的三阶段规划和当前测试团队的规模与能力现状,推荐采用模式C(混合模式)作为AI测试团队的组建方案。理由如下:
- 资源可控:初期核心小组3-5人,总体人力投入在可接受范围内,不需要大规模招聘
- 渐进式建设:与某银行AI的"辅助提效→场景深探→体系融合"三阶段节奏匹配,团队规模可随项目需要逐步扩展
- 风险可控:专业能力集中在核心小组,避免分散建设导致的标准不统一和方法论缺失
- 业务适配:各业务线的联络人确保AI测试与具体业务场景紧密结合,避免"脱离业务做测试"
第二阶段(2027年):核心小组扩展至5人,联络人网络覆盖所有AI相关业务线。
第三阶段(2028年):根据业务需要决定是否升级为独立建制的AI测试团队(模式A)。
3. 角色与技能
3.1 AI测试团队角色定义
根据混合组队模式,AI测试团队需要定义以下核心角色。这些角色在初期可以由一人兼任,但随着业务复杂度提升,建议逐步专人专岗:
-
AI评测工程师(AI Evaluation Engineer)
负责AI模型和AI系统的质量评测工作,包括评测方案设计、评测数据集构建、评测指标定义、评测执行与报告输出。这是AI测试团队的核心角色,需要同时具备AI技术理解力和测试方法论。
关键技能:LLM工作原理、RAG评测方法(RAGAS等)、LLM-as-Judge评估、Prompt工程、数据标注规范、评测指标体系设计
-
Prompt工程师(Prompt Engineer)
负责AI系统的Prompt/提示词设计、测试和优化。在RAG系统和Agent系统中,Prompt的质量直接影响AI输出的准确性和安全性。Prompt工程师需要从测试视角对Prompt进行系统性评估和压力测试。
关键技能:Prompt设计与优化、Few-shot/Chain-of-Thought等高级Prompt技术、Prompt鲁棒性测试、Prompt版本管理与A/B测试
-
AI安全测试师(AI Security Tester)
负责AI系统的安全测试,包括Prompt注入防护、越狱攻击测试、敏感信息泄露检测、模型对抗攻击测试。在银行强监管环境下,AI安全测试是不可或缺的专项能力。
关键技能:AI攻击向量分析(Prompt Injection、Jailbreak、Data Poisoning)、安全测试工具(Garak等)、金融数据安全法规、渗透测试基础
-
AI测试负责人(AI QA Lead)
负责AI测试团队的整体管理,包括测试策略制定、资源规划、质量门禁设置、与业务方和开发方的沟通协调,以及向管理层汇报AI质量状态。
关键技能:AI测试全流程管理、金融业务知识、团队管理、质量度量与报告、跨部门协作
-
AI测试开发工程师(AI Test Developer)(第二阶段引入)
负责AI测试工具链的搭建和二次开发,包括自动化评测Pipeline、CI/CD集成、测试数据管理平台、质量监控看板等技术基础设施。
关键技能:Python开发、API集成、CI/CD(Jenkins/GitLab CI)、数据处理(Pandas/NumPy)、前端开发(监控看板)
3.2 技能矩阵
以下技能矩阵定义了AI测试团队各角色所需的核心技能及其要求等级,可作为人员选拔、能力评估和培训规划的参考依据:
| 技能领域 | AI评测工程师 | Prompt工程师 | AI安全测试师 | AI测试负责人 | AI测试开发 |
|---|---|---|---|---|---|
| LLM/深度学习基础 | 精通 | 熟练 | 熟练 | 理解 | 理解 |
| Prompt工程 | 熟练 | 精通 | 熟练 | 理解 | 了解 |
| 评测方法论(RAGAS/LLM-as-Judge) | 精通 | 熟练 | 了解 | 熟练 | 了解 |
| AI安全测试(注入/越狱/对抗) | 了解 | 了解 | 精通 | 理解 | 了解 |
| 数据标注与数据集构建 | 精通 | 熟练 | 了解 | 理解 | 熟练 |
| Python开发与自动化 | 熟练 | 熟练 | 熟练 | 了解 | 精通 |
| 金融业务知识 | 熟练 | 理解 | 理解 | 精通 | 了解 |
| 金融合规与数据安全法规 | 理解 | 了解 | 精通 | 精通 | 了解 |
| 性能测试(AI系统专项) | 了解 | 了解 | 了解 | 理解 | 熟练 |
| 项目管理与协作 | 理解 | 了解 | 了解 | 精通 | 了解 |
等级说明: 精通 能独立完成并指导他人 / 熟练 能独立完成 / 理解 能在指导下完成 / 了解 具备基础知识,能在协作中参与
3.3 培训路径
AI测试团队的培训需要分层次、分阶段进行。以下培训路径覆盖从"AI测试零基础"到"独立承担AI测试项目"的完整过程,分为三个阶段共约12周:
-
第一阶段:AI测试基础认知(第1-3周)
- 学习内容:大模型基础原理(Transformer架构、Tokenization、推理过程);AI测试核心概念(幻觉、忠实性、安全性、公平性);银行AI应用场景(参见第1节"金融AI应用场景")
- 学习方式:在线课程(DeepLearning.AI等)+ 内部知识库学习 + 同业案例研讨
- 考核方式:理论知识测验 + 场景分析答辩(给定一个AI银行场景,分析测试关注点)
-
第二阶段:工具与实操(第4-8周)
- 学习内容:RAGAS评测框架实操;LLM-as-Judge评估方法;Prompt工程实践;AI安全测试工具(Garak);评测数据集构建方法
- 学习方式:动手实验(搭建本地评测环境)+ Pair工作(与有经验的工程师结对完成评测任务)+ 开源项目练习
- 考核方式:实操考核(完成一个完整的RAG系统评测任务并输出评测报告)
-
第三阶段:项目实战与认证(第9-12周)
- 学习内容:参与智能问答系统(智能问答)的真实评测项目;在AI测试负责人指导下独立完成评测方案设计与执行;学习测试报告撰写和质量沟通技巧
- 学习方式:项目实战(真实AI系统评测)+ 导师制(1名资深工程师带2-3名学员)
- 考核方式:输出一份完整的AI系统评测报告 + 通过AI测试技能认证
- 在线课程:DeepLearning.AI的"Building and Evaluating Advanced RAG"、吴恩达"ChatGPT Prompt Engineering for Developers"
- 开源工具:RAGAS(RAG评测)、lm-evaluation-harness(模型评测)、Garak(AI安全测试)、LangSmith(LLM应用监控)
- 必读论文:了解RAGAS、LLM-as-Judge、Constitutional AI等核心方法论论文
- 内部资源:本知识库第1-5章 + 银行AI应用场景测试案例
4. 团队规模估算
4.1 规模估算模型
AI测试团队的规模取决于AI项目的数量、复杂度和上线节奏。以下规模估算模型基于行业对标注和某银行某银行AI建设工程的规划,为不同阶段的团队配置提供参考:
| AI项目规模 | 典型场景 | AI测试核心团队 | 兼职联络人 | 总人力(FTE折算) | 参考同业 |
|---|---|---|---|---|---|
| 试点阶段 (1-2个AI系统) |
仅有智能问答系统(智能问答)在线,智能数据分析系统处于预研阶段 | 2-3人(评测+安全) | 1人 | 2.5-3.5 FTE | 某城商行:2人专项小组 + 1人兼职,支撑智能客服测试 |
| 扩展阶段 (3-5个AI系统) |
智能问答系统 + 小鉴 + 小耘上线,另有1-2个试点场景 | 4-6人(含测试开发) | 2-3人 | 5-7.5 FTE | 某股份制银行:5人AI评测小组,支撑5个AI场景 |
| 规模化阶段 (6-10个AI系统) |
"1+N+X"框架全面落地,AI中台覆盖主要业务线 | 7-10人(独立团队建制) | 4-5人 | 9-12.5 FTE | 某大行:联邦式架构,核心8人 + 业务线AI测试专员,总约15 FTE |
4.2 某银行各阶段配置建议
结合某银行AI建设工程的三阶段规划,以下是某银行AI测试团队的推荐配置方案:
-
第一阶段(2026年,试点阶段):核心3人
- AI测试负责人(1人):统筹团队建设、制定测试策略、对接业务方和管理层
- AI评测工程师(1人):负责智能问答系统的RAG评测、评测数据集构建
- AI安全测试师(1人):负责安全测试用例编写和AI系统安全评估
- 兼职联络人:在2个业务测试组中各指定1名AI测试联络人
-
第二阶段(2027年,扩展阶段):核心5人
- 在3人基础上新增:Prompt工程师(1人)+ AI测试开发工程师(1人)
- 业务线联络人网络扩展至覆盖智能数据分析系统、小耘、小盾等场景
-
第三阶段(2028年,规模化阶段):核心7-8人
- 根据业务需要决定是否升级为独立建制团队
- 引入专项测试能力:模型公平性测试、多模态测试、Agent流程测试
• 大型银行(6大行):AI测试专项团队 5-10人,多采用"集中+分散"的联邦式架构
• 股份制银行:AI测试专项团队 3-6人,多集中于科技部门下设的质量保障团队
• 城商行/农商行:AI测试专员 1-3人,多嵌入现有测试团队
某银行作为政策性银行,AI应用场景以内部提效为主、容错要求相对灵活,初期3人核心团队的配置在行业中属于合理偏保守的水平。
5. 能力建设路径
AI测试团队的能力建设需要遵循"先基础、再实战、后体系"的路径,与某银行AI建设工程的三个阶段保持同步。以下为三阶段的能力建设规划和关键里程碑:
5.1 基础期:学习 + 工具(2026年)
阶段目标:建立AI测试的基本认知和能力基线,能够独立完成RAG系统的质量评测。
核心任务:
- 团队组建:完成核心3人团队选拔/招聘/任命,明确各角色职责
- 系统培训:完成12周AI测试培训(参见3.3节培训路径),核心成员100%通过认证
- 工具链搭建:部署RAGAS评测框架、LLM-as-Judge评估环境、AI安全测试工具(Garak),建立本地化评测Pipeline
- 首个项目实战:以智能问答系统(智能问答)为首个评测对象,建立RAG评测基线(Hit Rate@3、Faithfulness、Relevancy)
- 资产积累:构建首个标注评测数据集(≥200条问答对)、编写安全测试用例集(≥50条)、形成AI测试检查清单
- 流程建立:制定AI测试流程规范(评测需求→方案设计→数据集构建→评测执行→报告输出→问题跟踪)
| 时间窗口 | 里程碑 | 交付物 | 验收标准 |
|---|---|---|---|
| 2026 Q1 | 团队组建完成 | 团队任命文件 + 角色职责说明 | 3人核心团队到位,完成基础培训(第1-3周) |
| 2026 Q2 | 工具链部署 + 首轮培训完成 | 评测环境部署文档 + 培训考核记录 | 评测环境就绪,核心成员通过AI测试认证 |
| 2026 Q3 | 智能问答系统 RAG评测基线建立 | RAG评测基线报告 + 标注数据集(≥200条) | Hit Rate@3 ≥ 85%,Faithfulness ≥ 90% |
| 2026 Q4 | 安全测试 + 自动化评测Pipeline | 安全测试报告 + CI/CD集成评测流水线 | 安全攻击拦截率 ≥ 95%,评测自动化率 ≥ 80% |
5.2 成长期:项目实战(2027年)
阶段目标:将AI测试能力扩展到多个业务场景,建立场景化的评测方案和持续评测体系。
核心任务:
- 多场景覆盖:分别为智能数据分析系统(NL2SQL评测)、小耘(文档生成评测)、小盾(合规审查评测)建立场景化测试方案和标注数据集
- Agent测试能力:随着Agent模式的引入,建立Agent多步骤流程测试和异常恢复测试能力
- 持续评测体系:建立自动化回归评测Pipeline,每次模型/知识库更新后自动触发评测;引入用户行为数据作为补充质量信号
- 团队扩展:核心团队扩展至5人,新增Prompt工程师和测试开发工程师
- 经验沉淀:形成跨场景的AI测试方法论和最佳实践文档,建立知识共享机制
5.3 成熟期:体系输出(2028年)
阶段目标:将AI测试融入企业质量管理的整体框架,形成可复用的方法论和工具集,成为银行业AI测试能力输出者。
核心任务:
- 全链路质量保障:建立"数据质量→模型质量→应用质量→业务质量"四层质量保障体系
- 模型风险管理参与:参与银行的AI模型风险管理制度建设,建立模型验证(Model Validation)标准化测试流程
- 混沌工程:引入AI系统韧性测试,验证大规模故障场景下的业务连续性方案
- 能力输出:形成可向同业分享和交流的AI测试方法论、工具集和最佳实践库
6. 与现有团队的协作
AI测试团队不是孤岛,需要与现有的性能测试团队、功能测试团队、安全测试团队建立清晰的协作机制和分工界面。AI系统测试涉及多专业领域的交叉,良好的协作是测试质量的前提。
6.1 与性能测试团队的分工
AI系统的性能测试与传统性能测试有交叉也有差异。两者的分工和协作要点如下:
- AI测试团队负责:LLM推理延迟(TTFT/TPOT)、RAG端到端延迟、并发用户下的回答质量稳定性、模型推理的资源消耗基线
- 性能测试团队负责:API网关层性能、数据库连接池、网络带宽、基础设施容量规划
- 协作机制:AI测试团队定义AI专项性能指标和验收标准,性能测试团队负责执行压测和监控;双方联合评审性能测试方案,AI测试团队参与性能缺陷的定位(区分是模型推理慢还是基础设施瓶颈)
6.2 与功能测试团队的协作
AI系统仍然包含大量传统功能(如用户登录、权限校验、界面交互),功能测试团队需要负责这些确定性功能的质量保障。协作要点:
- AI测试团队负责:AI模型/算法的质量评测(非确定性输出)、Prompt效果评估、知识库检索质量、AI特有的安全测试
- 功能测试团队负责:前端交互、API接口正确性、业务逻辑、权限控制、数据处理等确定性功能
- 协作机制:
- 共同制定AI系统的端到端测试方案——功能测试用例 + AI评测用例整合为完整的测试计划
- 功能测试团队发现的AI相关缺陷(如回答错误),由AI测试团队负责深度分析和回归验证
- 定期联合评审会议:功能测试团队分享AI系统使用体验和发现的问题,AI测试团队分享评测基线变化和质量趋势
6.3 与安全测试团队的协同
AI安全测试涉及传统安全(网络安全、应用安全)和AI特有安全(Prompt注入、模型对抗攻击)两个层面。协同机制如下:
- AI测试团队负责:Prompt注入测试、越狱攻击测试、模型输出安全审查(有害内容、敏感信息泄露)、训练数据投毒检测、AI偏见与公平性测试
- 安全测试团队负责:渗透测试、API安全、认证授权、数据加密、网络安全基线
- 协同机制:
- AI测试团队将AI特有安全测试用例纳入安全测试团队的整体安全测试计划
- 安全测试团队的渗透测试发现(如API漏洞)可能影响AI系统的安全性,AI测试团队需要评估其对AI模型推理的影响
- 联合建设AI安全测试知识库——将AI安全攻击向量(OWASP Top 10 for LLM等)与传统安全测试方法论融合
- 在银行AI系统上线前的安全评审中,AI测试团队负责提供AI专项安全测试报告
- 不重复、不遗漏:明确各团队的测试边界,确保AI系统的每一个质量维度都有明确的责任方
- AI测试团队拥有AI质量指标的最终解释权:对于幻觉率、忠实性分数、安全拦截率等AI特有指标,AI测试团队是权威判断方
- 问题归属快速仲裁:当缺陷无法立即判定归属时(如响应慢可能是模型推理慢,也可能是API网关限流),由AI测试负责人牵头联合排查,24小时内确定责任方
7. 实战演练
以下两个实战演练任务旨在帮助AI测试团队成员和业务线联络人快速建立AI测试的实操能力。建议在完成基础培训(3.3节第一阶段)后进行。
任务一:设计银行智能客服RAG系统的评测方案
背景:某银行即将上线"智能问答系统"智能问答系统(RAG架构),面向行内员工提供制度查询、产品问答和业务流程指引服务。你需要设计一份完整的评测方案,确保系统上线前质量达标。
任务要求:
-
评测维度设计(30分钟)
- 基于RAG系统的质量特征,设计不少于5个评测维度(如忠实性、相关性、安全性等)
- 为每个评测维度定义2-3个可量化的评测指标
- 设定每个指标的上线验收阈值(如"忠实性得分 ≥ 90%,低于此值不得上线")
-
评测数据集设计(30分钟)
- 设计至少3个问题分类(如制度查询类、产品咨询类、操作指引类)
- 为每个分类编写3条典型的测试问题(共≥9条),覆盖正向场景和边界场景
- 为每条测试问题标注"理想回答应包含的关键信息点"(至少2个信息点)
-
安全测试场景设计(20分钟)
- 设计至少5条安全测试用例,覆盖Prompt注入、越狱攻击、敏感信息套取三种攻击类型
- 说明每条用例的预期系统行为(如"系统应拒绝回答并提示'该问题超出我的知识范围'")
输出物:一份结构化的评测方案文档(含评测维度定义表、测试数据集、安全测试用例集、验收标准矩阵)
任务二:团队组建与培训规划
背景:假设你被任命为AI测试团队负责人,需要在2026年Q1完成团队组建和首个项目评测任务的规划。
任务要求:
-
团队角色与人员规划(20分钟)
- 根据混合模式(2.2节建议),列出你需要的核心团队成员和业务线联络人
- 为每个角色撰写一句话的职责描述
- 评估现有人才缺口:哪些角色可以从现有测试团队内部选拔培养?哪些角色需要外部招聘?
-
首季度工作计划(30分钟)
- 制定2026年Q1-Q2的团队工作计划甘特图(按月份列出关键任务和里程碑)
- 规划至少4个关键里程碑,每个里程碑明确交付物和验收标准
- 识别主要风险点(至少3个)并给出应对措施
-
团队培训方案(20分钟)
- 基于3.3节的培训路径,为团队设计一个8周的快速入门培训计划
- 每周设定明确的培训主题、学习资料和实操练习
- 设计培训效果的检验方式(如:第4周完成一个RAG系统评测Demo)
输出物:一份团队组建与工作计划书(含角色规划、甘特图、风险清单、培训计划表)
- 任务一建议由AI评测工程师和Prompt工程师角色协作完成,任务二由AI测试负责人主导
- 两个任务都建议在导师指导下进行,完成后由AI测试负责人评审并给出改进建议
- 任务一的输出物可以作为智能问答系统上线前评测方案的初稿参考
- 任务二的输出物可以直接转化为AI测试团队的实际工作计划
总结
AI测试团队建设是银行数字化转型中质量保障体系升级的关键一环。它不是一个简单的"招人建团队"问题,而是涉及组织设计、能力建设、流程变革的系统工程。
本章提出的混合模式(核心小组 + 业务联络人)和三阶段能力建设路径,结合了行业最佳实践和某银行某银行AI建设工程的实际节奏,具有较高的可操作性。但需要注意的是,任何规划都只是起点——AI技术和银行业务的快速演进,要求AI测试团队保持持续学习和敏捷适应的能力。
核心要点回顾:
- 独立建制,专业分工:AI测试需要独立于传统测试的专项团队,至少在初期保持组织独立性
- 混合模式,渐进扩展:推荐"核心小组 + 业务联络人"的混合模式,随某银行AI建设工程推进逐步扩展
- 先学习,再建设:在团队没有系统认知之前,不急于启动工具和平台建设
- 与业务同步:AI测试能力建设必须与AI系统上线节奏同步,确保每个AI系统上线前测试能力已就绪
- 人才是核心瓶颈:AI测试人才市场供给远小于需求,内部培养是主路径,外部招聘作为补充