大模型身瘦路更宽

2025-01-26 09:59来源: 经济日报

调查问题加载中,请稍候。
若长时间无响应,请刷新本页面

  作者:佘惠敏

  春节将至,中国人工智能(AI)公司密集发放节日大礼包,展现出2025年大模型竞争的新动向。仅1月20日一天就有4家公司推出新品:深度求索公司DeepSeek发布了DeepSeek-R1模型,月之暗面公司Kimi推出了k1.5多模态思考模型,两家公司新模型性能都对标OpenAI o1正式版。MiniMax海螺上线语音功能,字节豆包上线实时语音大模型,很明显是在对标OpenAI的实时语音功能。

  自2022年11月美国人工智能公司OpenAI发布GPT-3.0引燃全球AI大模型热潮以来,全球科技厂商纷纷入局,密集上线大模型。

  OpenAI的火爆来自“大力出奇迹”路线,以规模作为大模型的制胜法宝。但这也让AI大模型的发展陷入了一个怪圈:为追求更高的性能,模型体积不断膨胀,参数数量呈现指数级增长。这种“军备竞赛”型开发模式,带来了惊人的能源消耗和训练成本,难以为继。受大模型训练的高昂成本拖累,OpenAI在2024年的亏损额可能达到50亿美元,业内专家预计到2026年其亏损将进一步攀升至140亿美元。

  而中国公司运用剪枝、量化、知识蒸馏等一系列创新技术,开启了大模型“瘦身”新风尚,走出一条“小而强”的新路径。以DeepSeek为例,R1在多个基准测试中与美国OpenAI公司的o1持平,但成本仅为o1的三十分之一。模型性能的追赶速度也很快,OpenAI推出正式版o1模型是在2024年12月,仅仅1个多月后,DeepSeek就发布了性能相当的R1模型。

  DeepSeek的成功证明,大模型创新不一定要依赖最先进的硬件,而是可以通过聪明的工程设计和高效的训练方法实现。这种技术突破不仅降低了AI大模型的硬件门槛和能源消耗,更重要的是为AI技术普惠化铺平了道路。因为更小的模型意味着更低的部署成本、更快的响应速度和更广泛的应用场景。在医疗、教育、制造等诸多领域,轻量级AI模型都将带来革命性的转变。

  从信息技术发展历史看,“小型化”进程也是大势所趋。计算机曾是占据整个房间的大型机,后来发展成可作为桌面设备的电脑,又进化为便携式笔记本。手机从古早的砖头式“大哥大”,改进为小巧的功能机,又进化至如今的智能终端。DeepSeek的成果,标志着AI大模型正在经历类似的进化过程。这种“小而强”的AI模型,将推动人工智能从实验室走向千家万户,从云端走向边缘端。

  模型并非越大越好,而是越精越妙。大模型“瘦身”促进了AI技术的创新和突破。为了在减少参数的同时保持甚至提升模型性能,研究人员不得不深入挖掘模型架构的优化空间,探索更高效的算法和训练方法。这一过程推动了人工智能基础理论的发展,也为相关技术的跨领域应用开创了新局面。

  当然,大模型“瘦身”没到终点站,仍面临诸多挑战。如何在保证模型性能的前提下实现最大程度的“瘦身”,是当前需要解决的关键问题。同时,“瘦身”后的模型如何在不同场景下保证适应性和稳定性,也需要进一步验证和优化。

  在快节奏的商业环境中,高效、灵活、低成本的解决方案更具竞争力。追求极致性价比,一向是中国公司的强项。在诸多中国公司的竞争中,AI大模型正从曾经的“庞然大物”逐渐蜕变为轻盈高效的“智慧精灵”,在保持强大认知能力的同时,大大降低了计算资源的消耗。中国公司也从模仿者和追随者,逐渐转变为创新者和引领者。展望未来,大模型“瘦身”后必将走向更宽广的坦途。(佘惠敏)

[责任编辑: 刘朝 ]
阅读剩余全文(
为你推荐
寒潮来袭,中国铁路北京局集团有限公司天津供电段供电维修车间组织应急抢险人员上岗待命,在雪后对铁道上方的接触网运行状态进行巡视,确保春运期间供电设备安全运行。据了解,该供电维修车间现有干部职工97人,平均年龄约31岁,曾获全国铁路青年文明号等荣誉。
27
当日,天津外国语大学国际教育学院的50多名留学生参加“书香钟书阁·共赏中国年”来华留学生春节文化体验活动。当日,天津外国语大学国际教育学院的50多名留学生参加“书香钟书阁·共赏中国年”来华留学生春节文化体验活动。
27
佳节将至,年味渐浓。
27
1月25日,春运迎来节前客流高峰。来自交通运输部数据显示,当日全社会跨区域人员流动量预计超2.7亿人次。来自交通运输部数据显示,当日全社会跨区域人员流动量预计超2.7亿人次。来自交通运输部数据显示,当日全社会跨区域人员流动量预计超2.7亿人次。
26
1月25日拍摄的中国海南国际文物艺术品交易中心和海南国际文化交流中心项目(无人机照片)。2025年以来,海南三亚中央商务区加速推进中国海南国际文物艺术品交易中心、海南国际文化交流中心建设工作。
26
1月24日,大熊猫“宝力”在美国首都华盛顿的史密森学会国家动物园吃竹子。位于美国首都华盛顿的史密森学会国家动物园24日举行大熊猫馆开馆仪式,新一对大熊猫“宝力”和“青宝”首次正式与公众见面。
26
莫斯科举办春节文化体验活动
26
春节将至,各地开展丰富多彩的活动,营造喜庆祥和的节日氛围。
25
春节日益临近,春运节前客流进入高峰期。在北京火车站,南来北往的旅客,背着行囊,带着收获,去往家的方向。
25
进入冬季,“冰城”哈尔滨市换上“冰雪新装”,一块块冰经过华丽蜕变,或化身为琼楼玉宇,或“淬炼”成玲珑冰雕,最终融入冰雪大世界、冰灯游园会等各处冬季景点中。
25
载入更多资讯
返回
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮