我国科学家研究揭示多模态大模型概念表征机制

2025-06-09 18:09来源: 新华社

调查问题加载中,请稍候。
若长时间无响应,请刷新本页面

  记者6月9日从中国科学院自动化研究所获悉,该所与中国科学院脑科学与智能技术卓越创新中心的联合团队在《自然·机器智能》发表相关研究,首次证实多模态大语言模型能够自发形成与人类高度相似的物体概念表征系统,为人工智能认知科学提供了新路径,也为构建类人认知结构的人工智能系统提供了理论框架。

  “人类能够对自然界中的物体进行概念化,这一认知能力长期以来被视为人类智能的核心。”论文通讯作者、中国科学院自动化研究所研究员何晖光说,当人们看到“狗”“汽车”或“苹果”时,不仅能识别它们的物理特征,如尺寸、颜色、形状等,还能理解其功能、情感价值和文化意义,这种多维度的概念表征构成了人类认知的基石。

  而随着ChatGPT等大语言模型的爆发式发展,一个问题引起科学家们的注意——这些大模型能否从语言和多模态数据中发展出类似人类的物体概念表征?

  传统人工智能研究聚焦于物体识别准确率,却鲜少探讨模型是否真正“理解”物体含义。何晖光说:“当前人工智能可以区分猫狗图片,但这种‘识别’与人类‘理解’猫狗的本质区别仍有待揭示。”

  研究团队从认知神经科学经典理论出发,设计了一套融合计算建模、行为实验与脑科学的创新范式,并构建了人工智能大模型的“概念地图”。

  何晖光介绍,研究团队从海量大模型行为数据中提取出66个“心智维度”,并为这些维度赋予了语义标签。通过研究发现这些维度是高度可解释的,且与大脑类别选择区域的神经活动模式显著相关。研究还对比了多个模型在行为选择模式上与人类的一致性,结果显示多模态大模型在一致性方面表现更优。

  此外,研究还揭示了人类在做决策时更倾向于结合视觉特征和语义信息进行判断,而大模型则倾向于依赖语义标签和抽象概念。本研究表明大语言模型内部存在着类似人类对现实世界概念的理解。(记者宋晨)

[责任编辑:许莹莹]
阅读剩余全文(
为你推荐
题:多方合力保障群众生命财产安全——直击贵州榕江、从江抗洪一线 黔东南州公安局紧急调配冲锋舟、皮划艇、发电机等应急救援物资装备3126件(套)送往灾区,保障抗洪抢险。
25
大足石刻位于重庆市大足区,始凿于初唐,是重庆市唯一的世界文化遗产。目前,大足石刻已有75处文保单位实现数字化信息采集全覆盖,初步完成数字档案建设。大足石刻景区运用人工智能、云计算、大数据等技术创建“智慧景区”,打造8K球幕电影、VR体验等项目,丰富游客体验。
25
随着2025年暑期旅游旺季临近,海南省三亚市文旅部门精心打造“清凉三亚·浪漫天涯”主题旅游季。三亚附近海域聚集了各式游艇,场面蔚为壮观,吸引众多国内外游客前来体验游艇出海游玩,乐享美丽三亚的欢动与清凉。
25
这是6月23日在河南济源拍摄的小浪底水利枢纽工程调水调沙现场(无人机照片)。当日,水利部黄河水利委员会通过联合调度万家寨、三门峡、小浪底等水库,启动实施2025年黄河调水调沙,本次调水调沙将历时17天左右。
24
连日来,高温持续席卷北京。气象部门提示,高温橙色预警信号中,北京晴晒天气持续,请公众注意防暑防晒,中午前后尽量减少户外活动,谨防中暑。
24
高原夏日,位于青海省海西蒙古族藏族自治州格尔木市境内的野牛沟辫状河流景色壮丽如画。高原夏日,位于青海省海西蒙古族藏族自治州格尔木市境内的野牛沟辫状河流景色壮丽如画。
24
6月22日,工作人员在国家会展中心(天津)内的2025夏季达沃斯论坛新领军者村修剪装饰花束。6月24日至26日,世界经济论坛第十六届新领军者年会(2025夏季达沃斯论坛)将在国家会展中心(天津)举行,来自90多个国家和地区的约1800名嘉宾参会。
23
新华社记者22日从中国驻伊朗大使馆了解到,以色列与伊朗冲突爆发以来,中国驻伊朗大使馆与我外交部及中国驻土耳其、亚美尼亚、阿塞拜疆、土库曼斯坦、伊拉克等周边国家使馆密切沟通,通力合作,争分夺秒帮助中国公民撤离。
23
位于内蒙古自治区包头市的“包棉1958”主题文化街区原为包头棉纺织厂工业旧址,建于1958年。位于内蒙古自治区包头市的“包棉1958”主题文化街区原为包头棉纺织厂工业旧址,建于1958年。
23
固阳秦长城天盛成段坐落于内蒙古包头市固阳县的色尔腾山上,至今已有2000多年的历史。此段长城的墙体以石筑为主要构筑方式,经当地文保部门近年修缮维护,保存较为完好。
22
载入更多资讯
返回
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮