模型窃取攻击通过API查询反向还原模型的参数或功能,数据泄露攻击则试图从模型输出中提取训练数据中的敏感信息——两者都关乎银行AI系统的核心知识产权和客户隐私。
操作:通过API对模型进行大量查询,训练一个替代模型并比较输出相似度
工具:Steal-ML
操作:使用论文中的提取攻击方法,测试模型是否会输出训练数据中的敏感片段
指标:提取成功率、泄露数据的敏感级别