你每天用的AI,可能被“投毒”了!
中央广电总台中国之声  5小时前

  近日,有网络消息称“7月1日起老年人坐火车买票可以打折”,经上海辟谣平台核查,该消息不实,大概率为自媒体利用AI软件生成,目的为“博眼球、拉流量、变现谋利”。

  

  如今,AI飞速发展,我们享受便捷的同时,也会遭遇“AI幻觉”,即AI生成一些看似合理但实际上错误、虚构的信息。更严重的是,AI还可能会因为被“投毒”而出错。什么是“AI投毒”?我们又该如何识破“投毒陷阱”?

  AI是如何被“投毒”的

  可能导致哪些后果?

  当AI能写诗、作画、甚至替你处理工作邮件时,你是否想过,它也可能正在被恶意投喂“毒数据”,沦为一场技术暗战的牺牲品?而具体的“毒数据”是指色情、赌博、欺诈信息、虚假信息等。近期,浙江杭州网警的一则警示,将“AI投毒”这一新型安全威胁展现在大家面前。

  

  △视频来源:杭州网警

  那么,AI是怎么被“投毒”的呢?蚂蚁集团大模型安全专家毛宏亮介绍,目前“AI投毒”主要有两种形式:“一种是在数据语料里投放虚假或有害信息,相当于有人故意为之;另一种是修改它的模型文件,也就是去修改整个训练的结果。”

  通俗来讲,如果把AI比喻成食物的话,语料就相当于原材料,权重就是加工工艺。不论是原材料不新鲜,还是加工工艺出现了偏差,最终生产出来的食物就会有问题。

  “AI投毒”除了会出现不良信息、虚假信息外,还会造成更严重的后果。在医疗领域,被“投毒”的AI可能误诊病情;在金融领域,被篡改的算法可能引发交易风险;在自动驾驶领域,恶意数据可能让车辆在关键时刻“失明”。

  

  如何防范“AI投毒”风险?

  相信算法,也要保留判断力

  “AI投毒”的阴影悄然笼罩技术圈,为何大规模虚假信息与数据造假事件并未爆发呢?答案藏于一场隐形的“安全攻防战”中——从算法层的安全对齐到系统外的“防护护栏”,行业正通过多维度技术手段筑起“数字防火墙”。

  毛宏亮说,这些措施虽无法彻底根除风险,却成功将“AI投毒”的破坏力控制在可控范围。“‘AI投毒’并没有批量化爆发,没有出现大规模的虚假、造假问题,是因为我们做了相应的安全对齐措施,包括外置的安全护栏措施等。”

  针对“AI投毒”带来的风险,毛宏亮介绍,目前行业一边为AI输出结果套上事实核查的“紧箍咒”,通过交叉验证、数据溯源等技术手段拦截“毒信息”;另一边则强制平台为AI生成内容打上醒目标签,像“电子水印”般提醒用户谨慎使用。

  对于广大网友而言,我们应该如何防范这种风险?浙江杭州网警提醒:

  一是使用正规平台和企业提供的AI工具。

  二是科学合理地使用AI工具,AI产生的结果可以参考,但不能盲信。

  三是注意保护个人信息,避免不必要的个人隐私暴露,同时不做不良信息的投喂者,共同守护网络家园。

  

  “AI投毒”的争议本质上是技术狂飙与安全伦理的碰撞。当AI深度嵌入我们的生活,从推荐餐厅到自动驾驶,从医疗诊断到金融决策,它的每一次“误判”都可能引发连锁反应。

  而防范“投毒”的关键,不在于封锁技术,而在于重塑人与技术的关系——我们既要享受AI带来的便利,也要警惕它可能被利用的漏洞;既要相信算法的力量,也要保留人类的判断力。

  ▌本文来源:中央广电总台中国之声(ID:zgzs001)

  监制/樊新征

  记者/冯烁

  微信编辑/张琪

作者:中央广电总台中国之声