史上最强AI?马斯克20万块GPU烧出的是史上能耗最高大模型

2025-02-20 07:28来源: 澎湃新闻

调查问题加载中,请稍候。
若长时间无响应,请刷新本页面

  20万块GPU“烧出”的Grok 3到底是不是地表最强AI?对此不乏争议。但毋庸置疑的是,Grok 3绝对是有史以来能耗最高的大模型。训练消耗的能源相当于一座小城市一年的用电量,或者4万多辆燃油车一年的碳排放量。

  Grok 3的诞生折射出其仍未摆脱以能耗换性能的传统“规模扩展”模式。在全行业开源之风渐浓、越来越推崇性价比的当下,如何在优化模型效率与降低能耗之间达到平衡,是Grok 3亟需解决的挑战。

  2月18日,马斯克在X平台直播发布Grok 3模型并进行现场演示。其自己给出的PPT上写着基准测试结果表明Grok 3在AIME'24数学能力测试、GPQA科学知识评估、LCB Oct - Feb编程能力测试等多项测试中击败了谷歌Gemini 2 Pro、DeepSeek V3、Anthropic的Claude 3.5 sonnet和OpenAI的GPT-4o。

  在大模型竞技场Chatbot Arena LLM排行榜上,代号巧克力的Grok 3早期版本登上榜一,成为有史以来第一个突破1400分的模型,各大模型无出其右。不过这一分数也只比DeepSeek R1高2.9%。PPT上柱状图之所以高低相差显著,是因为图片是从1300开始截图,等于自带“放大”效果。

史上最强AI?马斯克20万块GPU烧出的是史上能耗最高大模型

  Grok 3的1400分与其他大模型差距有限。之所以看起来“遥遥领先”,是因为柱状图的起始点为1300,自带“放大”效果

  事实上,直播也有多次“翻车”,比如马斯克用Grok 3演示飞向火星代码,输出直接崩溃:两次生成失败。马斯克只能与工作人员尬聊撑时间,让后台第三次生成才成功。

  直播后,部分X用户测试了最新的Beta版Grok 3,并提出了那个经典的用来刁难大模型的问题:“9.11与9.9哪个大?”号称最聪明的Grok 3居然答错了。

  考虑到Grok 2发布时也是极其轰动,但此后使用效果却不够AI,这次Grok 3会不会重蹈“跑分没输过,实用没赢过”,还是未知数。不过目前可以肯定的是,这款马斯克口中“地球上最聪明的AI”靠的是算力堆叠,这背后的训练成本极其庞大。

  他在直播中首次透露,Grok 3的训练量是Grok 2的10倍,基于人工智能初创公司xAI位于孟菲斯的超级计算机集群进行。该集群建造的第一阶段,xAI在122天内建成了拥有10万块NVIDIA H100 GPU的超级计算集群,第二阶段拓展到20万块GPU集群,仅耗时92天。

  有人计算了xAI在孟菲斯GPU的成本,仅以10万块H100、每块GPU费用30000美元计算,Grok 3的总硬件消耗就已超出30亿美元。

  相比之下,6710亿参数的DeepSeek V3在配备2048块算力受限的英伟达H800 GPU集群上训练,整个训练流程用时278.8万个H800 GPU小时,总成本为557.6万美元。在GPU用量、训练用时、算力成本上,较同等性能的闭源模型大幅缩减。低成本比肩对标的闭源模型,DeepSeek的横空出世令硅谷的“烧钱模式”遭到猛烈质疑。

  有分析称,Grok 3的算力消耗为DeepSeek V3的263倍,尽管前者在数学推理和编程能力上表现更优异,但这彰显了两者在资源使用上的极大差异。能耗方面,H100的典型功耗约为700瓦,以此计算,Grok 3使用的GPU总能耗相当于一个小城市的用电量。假设电力来源为混合能源(平均碳排放系数0.5千克二氧化碳/千瓦时),Grok 3训练产生的碳排放大致相当于4万多辆燃油车一年的碳排放量。

  “Grok 3像20支AK绑在一起狂射,DeepSeek像在练定向狙击,一个是土豪堆装备的打法、一个是在算力有限的情况下压缩能耗实现性能最大化,后者强调了人类在其中的作用和价值,是真正的AI精神和未来的方向。”有网友如是比喻道。

  马斯克与xAI团队在Grok 3直播演示中称,20万块GPU需要功率多达250MW的电力。“(面对电力缺口)我们最初租赁了一大堆发电机……又租用了美国四分之一的制冷能力……从来没有人建造过如此大规模的液冷数据中心。”他们同时预告,xAI已在着手研究下一个更强大的算力集群,所需电力高达1.2GW。

  不久之前,xAI的超级计算机集群在所在地再度引发环保争议。究其本质,正是能耗巨兽Grok 3带来的环境压力。

  据美国田纳西州孟菲斯市当地媒体日前报道,xAI计划在未来继续使用燃气轮机为其超级计算机供电。今年1月,xAI附属公司CTC Property向田纳西州谢尔比县申请了15台燃气轮机的运营许可证,许可证将允许这些燃机从2025年6月至2030年6月持续运行。

  这批燃气轮机引发了环境方面的担忧。xAI的设施位于前伊莱克斯工厂,据当地媒体援引许可证申请文件数据,该燃机每年受控和不受控有害空气污染物(HAP)的排放量为11.51吨,超过美国环保署(EPA)对单一排放源HAP设置的每年10吨上限。在xAI设施周边5英里范围内居住的居民接近2.2万人。

  环保组织南方环境法中心(Southern Environmental Law Center)发言人称,这些燃气轮机自2024年夏季以来一直在运行,xAI在未向公众发出通知,也未受到监管的情况下启用燃机,使得孟菲斯本就很差的空气质量更加糟糕。

  xAI与当地环保群体之间的矛盾存在已久。去年8月,南方环境法中心向当地环保当局提出质疑,要求核实xAI是否在没有空气许可证的情况下使用燃气轮机为其超级计算机供电。

  管理当地电网的孟菲斯电力、煤气和水务公司(MLGW)在1月份告诉市议会,燃气轮机是暂时的,xAI的算力扩充计划需要额外的150MW电力,MLGW仍在研究这对于当地电力系统的影响。

  澎湃新闻记者 杨漾

[责任编辑: ]
阅读剩余全文(
为你推荐
当日,静安首发品牌馆亮相上海张园。静安首发品牌馆分为老字号展陈、国潮品牌“出海”、首发街区等展区,呈现静安首发品牌活力,加强商旅文体展联动,进一步强化首发经济的辐射带动效应。
17
2022年12月起,来自全国各地的中铁二十局建设者持续奋战在柳江区三都镇鱼宜高速公路建设工地,为当地发展注入新活力。
17
根据西藏传统天文历算推算,3月16日西藏各地农区举行春耕大典。按照传承千年的春耕民俗,农民身着节日盛装,在田间地头忙碌,播撒希望的种子。新一年的丰收征程就此拉开序幕。
17
统计数据显示,截至3月15日,《哪吒之魔童闹海》全球票房(含预售及海外)超150.19亿元,超越《星球大战:原力觉醒》,位列全球影史票房榜第五位。
16
3月15日,在浙江省湖州市德清县洛舍镇卫生院,就诊儿童在进行骨龄测量。当日,浙江省湖州市德清县洛舍镇卫生院儿童体重管理门诊正式运行。
16
当日,贵州省黔东南苗族侗族自治州榕江县三宝侗寨举办2025年“萨玛节”活动,数千名侗族群众参加祭萨仪式、千人多耶、舞稻草龙等民俗活动。
16
近日,云南昆明圆通山公园的樱花进入盛花期,吸引众多市民游客前来踏青赏花,感受春天的气息。近日,云南昆明圆通山公园的樱花进入盛花期,吸引众多市民游客前来踏青赏花,感受春天的气息。
15
春分将近,洞庭湖畔进入了忙碌的春耕备播阶段,备肥备种、秧棚检修、农机保养……一系列紧张而繁忙的农活面前,“新农人”邱彬也不例外。从只会操作植保无人机,到得心应手地驾驶叉车、拖拉机,邱彬逐步成长为农业机械化中的“新农人”。
15
眼下,山东春季农业生产有序推进,各地抢抓农时,积极开展春耕春管,为农业稳产、丰产打下坚实基础。眼下,山东春季农业生产有序推进,各地抢抓农时,积极开展春耕春管,为农业稳产、丰产打下坚实基础。
15
3月13日,在青岛西海岸新区绿色增粮先行示范区农田里,自走式喷杆喷雾机进行小麦茎基腐病春季防控作业。当日,山东省青岛市春季农业生产暨绿色增粮单产提升现场会举行,当地相关部门组织农业“四新”(新技术、新装备、新模式、新品种)观摩学习。
14
载入更多资讯
返回
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮