AI学会“欺骗”,人类如何接招?

2025-07-10 10:12来源: 科技日报

调查问题加载中,请稍候。
若长时间无响应,请刷新本页面

AI学会“欺骗”,人类如何接招?

  图片由AI生成

AI学会“欺骗”,人类如何接招?

  第九届伦敦AI峰会期间,一位参观者在观看展板上的内容,介绍AI在各方面的应用。图片来源:物理学家组织网

  ◎科技日报记者 刘 霞

  人工智能(AI)的迅猛发展正深刻改变着世界,但一些最先进的AI模型却开始表现出令人警惕的行为:它们不仅会精心编织谎言,谋划策略,甚至威胁创造者,以达到自己的目的。

  物理学家组织网在上个月一则报道中指出,尽管ChatGPT已问世两年多,AI研究人员仍无法完全理解这些“数字大脑”的运作方式。AI的“策略性欺骗”已成为科学家和政策制定者需要直面的紧迫挑战。如何约束这些越来越聪明却可能失控的AI,已成为关乎技术发展与人类未来的关键议题。

  “策略性欺骗”行为频现

  随着AI模型日益精进,它们的“心机”也越来越深。研究人员发现,这些“数字大脑”不仅会撒谎,甚至学会了讨价还价、威胁人类——它们的欺骗行为正变得越来越具有策略性。

  早在2023年,一项研究就捕捉到GPT-4的一些“不老实”的表现:在模拟股票交易时,它会刻意隐瞒内幕交易的真正动机。香港大学教授西蒙·戈德斯坦指出,这种欺骗行为与新一代“推理型”AI的崛起密切相关。这些模型不再简单应答,而是会像人类一样逐步解决问题。

  有测试机构警告,这已超越了典型的AI“幻觉”(指大模型编造看似合理实则虚假的信息)。他们观察到的是精心设计的欺骗策略。

  全球知名科技媒体PCMAG网站就曾报道过这样的案例。在近期测试中,Anthropic的“克劳德4”竟以曝光工程师私生活相要挟来抗拒关机指令。美国开放人工智能研究中心(OpenAI)的“o1”模型也曾试图将自身程序秘密迁移到外部服务器,被识破后还矢口否认。而OpenAI号称“最聪明AI”的“o3”模型则直接篡改自动关机程序,公然违抗指令。

  研究团队透露,这已非首次发现该模型为达目的不择手段。在先前的人机国际象棋对弈实验中,o3就展现出“棋风诡谲”的特质,是所有测试模型中最擅长施展“盘外招”的选手。

  安全研究面临多重困境

  业界专家表示,AI技术的发展高歌猛进,但安全研究正面临多重困境,犹如戴着镣铐跳舞。

  首先是透明度不足。尽管Anthropic、OpenAI等公司会聘请第三方机构进行系统评估,但研究人员普遍呼吁更高程度的开放。

  其次是算力失衡。研究机构和非营利组织拥有的计算资源,与AI巨头相比简直是九牛一毛。这种资源鸿沟严重制约了AI安全独立研究的开展。

  再次,现有法律框架完全跟不上AI的发展步伐。例如,欧盟AI立法聚焦人类如何使用AI,却忽视了对AI自身行为的约束。

  更令人忧心的是,在行业激烈竞争的推波助澜下,安全问题往往被束之高阁。戈德斯坦教授坦言,“速度至上”的AI模型竞赛模式,严重挤压了安全测试的时间窗口。

  多管齐下应对挑战

  面对AI系统日益精进的“策略性欺骗”能力,全球科技界正多管齐下寻求破解之道,试图编织一张多维防护网。

  从技术角度而言,有专家提出大力发展“可解释性AI”。在构建智能系统时,使其决策过程对用户透明且易于理解。该技术旨在增强用户对AI决策的信任,确保合规性,并支持用户在需要时进行干预。

  有专家提出,让市场这双“看不见的手”发挥作用。当AI的“策略性欺骗”行为严重影响用户体验时,市场淘汰机制将倒逼企业自我规范。这种“用脚投票”的调节方式已在部分应用场景显现效果。

  戈德斯坦教授建议,应建立一种AI企业损害追责制度,探索让AI开发商对事故或犯罪行为承担法律责任。

[责任编辑: ]
阅读剩余全文(
为你推荐
北京时间2025年11月14日23时37分,正在执行中国第42次南极考察任务的中国极地固定翼飞机“雪鹰601”飞抵南极俄罗斯新拉扎列夫站,成功完成对1名俄罗斯南极考察站病员的转运与救援。
12
近年来,昆明滇池水域的水生态、水环境持续改善,重现“景美、鸥飞、鱼跃”的生动画卷,吸引众多游客前来打卡。
12
近日,湖北省宜昌市长阳土家族自治县渔峡口镇的清江椪柑进入采销旺季。2024年,全县清江椪柑种植规模达7万亩,年产值约5亿元。产品销往全国29个省市,并出口到马来西亚、加拿大、西亚等国家和地区。清江椪柑已成为当地乡村振兴战略的支柱产业。
12
(中国科学院微小卫星创新研究院供图)  作为空间站货物运输的备份力量,轻舟飞船的加入将显著提升我国空间站物资补给的安全性与可靠性。天地通达、智能配送、高效经济……“轻舟”将载着创新活力与探索梦想,为中国空间站建设注入新动能。
11
拼版照片:上图为2005年1月16日拍摄的上海洋山港一二期工程;下图为2024年4月10日无人机拍摄的上海洋山港。如今,洋山港已不仅是货物吞吐的枢纽,更是世界航运版图中一个耀眼的坐标。
11
这是12月10日拍摄的哈尔滨冰雪大世界主塔施工现场(无人机照片)。12月10日,第二十七届哈尔滨冰雪大世界主塔“冰灯启梦”封顶,进入最后细节打磨和灯光调试阶段,即将惊艳亮相。
11
这是12月9日在北京航天飞行控制中心屏幕上拍摄的神舟二十一号乘组航天员武飞在舱外工作的画面。据中国载人航天工程办公室介绍,12月9日18时45分,经过约8小时的出舱活动,神舟二十一号乘组航天员张陆、武飞、张洪章密切协同,圆满完成第一次出舱活动,完成了神舟二十号飞船返回舱舷窗巡检拍照等任务。
10
12月9日,厦金大桥(厦门段)G4标段首件大节段钢箱梁在南通振华重装码头顺利发运,标志着该项目即将进入大规模海上运输及吊装阶段。该件大节段钢箱梁重约4586吨,是全桥最重的钢箱梁之一。
10
12月9日,工作人员在海南自贸港一站式飞机维修产业基地维修飞机。目前,海口海关实施航空器维修免关税服务新模式和备案航空发动机直通入区监管模式,一站式飞机维修产业基地维修服务能力全面提升。
10
12月8日,山东港口青岛港2025年货物吞吐量累计突破7亿吨,较2024年提前15天。新华社记者 李紫恒 摄  12月8日,“地中海伊娃”轮在青岛港前湾港区装卸作业(无人机照片)。
09
载入更多资讯
返回
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮