新训练方法提高AI模型准确率和透明度

2026-04-08 09:44来源: 科技日报

调查问题加载中,请稍候。
若长时间无响应,请刷新本页面

  在医疗诊断、自动驾驶等高风险场景中,人工智能(AI)模型决策的可解释性至关重要。据美国麻省理工学院官网近日消息称,为了提高透明度,该校团队开发出一种新方法,能够从已训练好的计算机视觉模型中自动提取关键概念,并迫使模型使用这些人类易于理解的概念进行解释和预测。这项进展有望在提升模型准确性的同时,增强用户对“黑盒”AI的信任。

  概念瓶颈模型是增强AI可解释性的常见技术。它是指在模型决策过程中增加一个中间步骤:先识别图像中与任务相关的、可被人理解的“概念”,再基于这些概念做出最终预测。例如,在肿瘤诊断中,模型可能先识别“成簇的棕色斑点”这一概念,再判断是否为黑色素瘤。

  然而,传统方法依赖人类专家或大语言模型预先定义概念集,这些概念可能与具体任务关联性不强,或缺乏足够细节,从而影响模型性能。另外,模型在训练时也可能“暗中”使用了定义之外的其他特征,导致解释与真实不符。

  此次,团队利用一个经过海量数据预训练的视觉模型,认为其内部已蕴含了完成任务所需的知识。他们设计了一种两阶段流程来提取和转化这些知识。首先,使用一个称为稀疏自编码器的专用模型,提取出最相关的特征,并将其压缩为少量核心概念。接着,由一个多模态大语言模型将这些特征转化为简洁的自然语言描述,并自动为数据集中图像标注这些概念真实与否。最后,利用这些标注数据训练一个概念瓶颈模块,并将其整合到原始模型中,强制模型仅使用这套提取的概念进行预测。

  团队在过程中限制了模型每次预测最多只能使用五个概念,迫使模型筛选出最关键的几个特征,使生成的解释既精炼又直接相关。

  测试中,鸟类物种识别和皮肤病变诊断等任务结果均表明,新方法在提供更精确、与图像更贴合的概念解释的同时,也取得了比现有概念瓶颈模型更高的预测准确率。这意味着,该方法不仅能更好地“解读”模型的思考过程,还能维持更优的性能。

  团队未来的工作还将致力于解决信息泄露等问题,并探索利用更强大的多模态大模型来标注更大规模的数据,以进一步提升方法的效能。 记者 张梦然

[责任编辑: ]
阅读剩余全文(
为你推荐
今年清明假期(4月4日至6日),公路人员流动量预计为77845万人次,日均预计为25948万人次,同比增长5.8%。
07
记者4月7日从自然资源部获悉,中国第42次南极考察队成功完成我国首次南极冰层热水钻探试验,钻深达3413米,突破了国际极地热水钻探的2540米的最深纪录。(图片来源:中国第42次南极考察队)  极地冰层热水钻探研究,是研究地球古环境变化、预测地球气候变化、探索生命边界、拓展人类认知的国际前沿科学研究。
07
清明假期,人们度假休闲,踏青游玩,释放“春日经济”新活力。清明假期,人们度假休闲,踏青游玩,释放“春日经济”新活力。清明假期,人们度假休闲,踏青游玩,释放“春日经济”新活力。
07
清明小长假期间,人们踏青赏景,乐享春光。清明小长假期间,人们踏青赏景,乐享春光。清明小长假期间,人们踏青赏景,乐享春光。清明小长假期间,人们踏青赏景,乐享春光。清明小长假期间,人们踏青赏景,乐享春光。
06
在海口美兰国际机场停机坪上,南航工程技术分公司机务工程师对“消博号”彩绘飞机进行深度检查(4月4日摄)。
06
4月5日,在安徽省铜陵市郊区大通镇大院村,农民给种下的铜陵白姜搭建姜棚。每年清明前后是铜陵白姜种植的最佳时节,人们躬身田间,把希望的姜种播进沃土,用勤劳的双手延续古老的农耕文明。
06
把满腔热血洒向热土  2025年4月2日,陆军第72集团军某旅组织官兵赴驻地抗日烈士陵园开展祭扫活动(无人机照片)。2024年1月1日,新疆军区某团官兵在海拔5000多米的喀喇昆仑高原巡逻。
05
4月4日,游客在江苏省高邮市湖上花海景区乘船游玩(无人机照片)。清明小长假,人们走出家门,踏青游玩。清明小长假,人们走出家门,踏青游玩。清明小长假,人们走出家门,踏青游玩。
05
4月初,春假与清明小长假“牵手”,各地中小学生参加丰富多彩的活动,享受欢乐时光。4月初,春假与清明小长假“牵手”,各地中小学生参加丰富多彩的活动,享受欢乐时光。4月初,春假与清明小长假“牵手”,各地中小学生参加丰富多彩的活动,享受欢乐时光。
05
记者从中国国家铁路集团有限公司获悉,为期5天的铁路清明假期运输3日启动,自4月3日至4月7日,全国铁路预计发送旅客9050万人次,日均发送旅客1810万人次,4月4日为客流最高峰日,预计发送旅客2120万人次。
04
载入更多资讯
返回
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮