新训练方法提高AI模型准确率和透明度

2026-04-08 09:44来源：科技日报

　　在医疗诊断、自动驾驶等高风险场景中，人工智能（AI）模型决策的可解释性至关重要。据美国麻省理工学院官网近日消息称，为了提高透明度，该校团队开发出一种新方法，能够从已训练好的计算机视觉模型中自动提取关键概念，并迫使模型使用这些人类易于理解的概念进行解释和预测。这项进展有望在提升模型准确性的同时，增强用户对“黑盒”AI的信任。

　　概念瓶颈模型是增强AI可解释性的常见技术。它是指在模型决策过程中增加一个中间步骤：先识别图像中与任务相关的、可被人理解的“概念”，再基于这些概念做出最终预测。例如，在肿瘤诊断中，模型可能先识别“成簇的棕色斑点”这一概念，再判断是否为黑色素瘤。

　　然而，传统方法依赖人类专家或大语言模型预先定义概念集，这些概念可能与具体任务关联性不强，或缺乏足够细节，从而影响模型性能。另外，模型在训练时也可能“暗中”使用了定义之外的其他特征，导致解释与真实不符。

　　此次，团队利用一个经过海量数据预训练的视觉模型，认为其内部已蕴含了完成任务所需的知识。他们设计了一种两阶段流程来提取和转化这些知识。首先，使用一个称为稀疏自编码器的专用模型，提取出最相关的特征，并将其压缩为少量核心概念。接着，由一个多模态大语言模型将这些特征转化为简洁的自然语言描述，并自动为数据集中图像标注这些概念真实与否。最后，利用这些标注数据训练一个概念瓶颈模块，并将其整合到原始模型中，强制模型仅使用这套提取的概念进行预测。

　　团队在过程中限制了模型每次预测最多只能使用五个概念，迫使模型筛选出最关键的几个特征，使生成的解释既精炼又直接相关。

　　测试中，鸟类物种识别和皮肤病变诊断等任务结果均表明，新方法在提供更精确、与图像更贴合的概念解释的同时，也取得了比现有概念瓶颈模型更高的预测准确率。这意味着，该方法不仅能更好地“解读”模型的思考过程，还能维持更优的性能。

　　团队未来的工作还将致力于解决信息泄露等问题，并探索利用更强大的多模态大模型来标注更大规模的数据，以进一步提升方法的效能。记者张梦然

[责任编辑: ]

阅读剩余全文（）

为你推荐

2026年清明假期公路人员流动量预计超7.78亿人次

今年清明假期（4月4日至6日），公路人员流动量预计为77845万人次，日均预计为25948万人次，同比增长5.8%。

07日

3413米：我国极地冰层钻探突破国际热水钻探最深纪录

记者4月7日从自然资源部获悉，中国第42次南极考察队成功完成我国首次南极冰层热水钻探试验，钻深达3413米，突破了国际极地热水钻探的2540米的最深纪录。（图片来源：中国第42次南极考察队）　　极地冰层热水钻探研究，是研究地球古环境变化、预测地球气候变化、探索生命边界、拓展人类认知的国际前沿科学研究。

07日

假期里的春日经济

清明假期，人们度假休闲，踏青游玩，释放“春日经济”新活力。清明假期，人们度假休闲，踏青游玩，释放“春日经济”新活力。清明假期，人们度假休闲，踏青游玩，释放“春日经济”新活力。

07日

假日踏青赏春

清明小长假期间，人们踏青赏景，乐享春光。清明小长假期间，人们踏青赏景，乐享春光。清明小长假期间，人们踏青赏景，乐享春光。清明小长假期间，人们踏青赏景，乐享春光。清明小长假期间，人们踏青赏景，乐享春光。

06日

海南：飞机“全面体检” 护航消博会

在海口美兰国际机场停机坪上，南航工程技术分公司机务工程师对“消博号”彩绘飞机进行深度检查（4月4日摄）。

06日

春日农耕忙姜田孕希望

4月5日，在安徽省铜陵市郊区大通镇大院村，农民给种下的铜陵白姜搭建姜棚。每年清明前后是铜陵白姜种植的最佳时节，人们躬身田间，把希望的姜种播进沃土，用勤劳的双手延续古老的农耕文明。

06日

英魂永耀山河间

把满腔热血洒向热土　　2025年4月2日，陆军第72集团军某旅组织官兵赴驻地抗日烈士陵园开展祭扫活动（无人机照片）。2024年1月1日，新疆军区某团官兵在海拔5000多米的喀喇昆仑高原巡逻。

05日

清明出游正当时

4月4日，游客在江苏省高邮市湖上花海景区乘船游玩（无人机照片）。清明小长假，人们走出家门，踏青游玩。清明小长假，人们走出家门，踏青游玩。清明小长假，人们走出家门，踏青游玩。

05日

春假牵手小长假——看他们的别样假期

4月初，春假与清明小长假“牵手”，各地中小学生参加丰富多彩的活动，享受欢乐时光。4月初，春假与清明小长假“牵手”，各地中小学生参加丰富多彩的活动，享受欢乐时光。4月初，春假与清明小长假“牵手”，各地中小学生参加丰富多彩的活动，享受欢乐时光。

05日

铁路清明假期运输预计发送旅客9050万人次

记者从中国国家铁路集团有限公司获悉，为期5天的铁路清明假期运输3日启动，自4月3日至4月7日，全国铁路预计发送旅客9050万人次，日均发送旅客1810万人次，4月4日为客流最高峰日，预计发送旅客2120万人次。

04日

载入更多资讯

全部导航

新训练方法提高AI模型准确率和透明度