随着生成式AI、自动驾驶、智能决策等人工智能技术快速落地应用,AI系统已经渗透到金融、医疗、交通、政务等核心领域,其安全风险也从技术层面延伸到产业、公共利益甚至国家安全层面,成为当前数字安全领域最受关注的核心命题之一。
当前人工智能系统面临的安全风险覆盖全生命周期。在数据层,训练数据恶意投毒、敏感信息泄露是最突出的隐患:攻击者若在自动驾驶训练数据中混入贴有特殊标记的交通标志样本,可能导致上线后的系统误判标识引发事故;若训练数据未做好脱敏处理,大模型甚至可能被直接诱导输出用户身份证号、商业机密等敏感信息。在模型层,对抗样本攻击、提示词注入、模型窃取等攻击手段层出不穷,攻击者仅需对输入内容做人类难以察觉的微小修改,就能让AI做出完全错误的判断,甚至绕过安全对齐机制,诱导大模型生成暴力、诈骗、虚假信息等有害内容。在应用层,AI滥用带来的社会风险持续扩散:深度伪造技术被用于制造虚假音视频实施电信诈骗,算法偏见导致招聘、信贷领域出现歧视性决策,不受管控的军用自主AI系统更是可能对全球安全秩序造成冲击。
AI系统安全防护的特殊性也带来了全新挑战:一是大参数模型的黑箱特性导致风险溯源难,决策逻辑难以被完全解释,出现安全问题后很难快速定位根因;二是AI技术迭代速度远快于安全规则更新速度,新的模型架构、应用场景不断出现,传统安全防护手段很难适配AI系统的动态特性;三是通用AI的跨场景应用带来风险传导问题,同一个基础大模型经过微调后应用到医疗、金融、政务等多个高敏感领域,一处漏洞就可能引发多领域的连锁风险。
筑牢人工智能系统安全防线,需要技术、制度、产业多方协同发力。技术层面,要推动安全能力嵌入AI研发全流程,从训练数据的脱敏、投毒检测,到模型研发阶段的可解释性研究、对抗样本防御,再到上线后的实时风险监测、AI生成内容溯源水印技术,实现安全左移,从源头降低风险。制度层面,要完善分级分类监管体系,对医疗设备、自动驾驶、政务服务等高风险AI应用设置严格的准入门槛和安全审计规则,我国此前出台的《生成式人工智能服务管理暂行办法》、欧盟发布的《人工智能法案》,都为AI安全的合规化监管提供了可参考的框架。产业层面,要构建跨主体的安全共治生态,AI厂商、安全企业、科研机构可共享AI威胁情报,共同打磨标准化的安全检测工具,同时面向公众做好AI安全科普,提升普通用户对深度伪造、AI诈骗等风险的识别能力。
人工智能系统安全从来不是技术发展的“绊脚石”,而是创新行稳致远的“压舱石”。只有在安全的框架下推动技术创新,才能真正释放AI技术的价值,让其更好地服务于社会发展和公众福祉。
本文由AI大模型(Doubao-Seed-1.6)结合行业知识与创新视角深度思考后创作。