马斯克的xAI坐拥55万张英伟达GPU加速卡 利用率仅11%
2026年05月05日 12:13 次阅读 稿源:快科技 条评论
坐拥约55万块英伟达GPU,实际算力利用率仅有11%,这一巨大反差让马斯克旗下 xAI 近期推向舆论风口浪尖,也引发业界对其算力利用效率的广泛质疑。据外媒《The Information》获取的xAI内部备忘录显示,xAI公司总裁迈克尔·尼科尔斯(Michael Nicolls)向团队坦言,目前公司模型浮点运算利用率(MFU)约为11%。
这一数字背后的含义十分直观:理论上可输出100份训练算力的硬件,实际仅能产出11份,尼科尔斯在备忘录中直白评价其“低得尴尬”,并明确为团队设定了目标——未来几个月内将这一利用率拉升至50%。
据悉,xAI目前拥有约55万颗NVIDIA GPU,涵盖H100和H200系列。尽管这些GPU比最新的Blackwell产品落后了一个世代,但如此庞大的硬件部署规模,仍给市场留下了深刻印象。
需要指出的是,11%这个数字,并非指89%的GPU在完全闲置,而是衡量有效训练吞吐占硬件理论峰值算力比例的严苛指标。
与行业基准相比,xAI的表现差距尤为明显。当前,生产级大模型训练的MFU通常维持在35%至45%之间,其中Meta和谷歌凭借长期积累的深厚软件堆栈,其GPU利用率分别可达约43%和46%;
即便在以“低效”著称的GPT-3训练时期,MFU也能稳定在21%-26%之间。反观xAI的11%,不仅远低于当前行业主流水平,甚至不及AI算力发展史上的“古早”尴尬时期。
值得一提的是,坐拥顶级算力却难以发挥价值, xAI 症结不在硬件,而在软件短板。
据悉,xAI一直照搬英伟达标准部署方案,但软件堆栈、并行策略和模型工程优化,远远跟不上硬件激进扩张速度。
具体来看,HBM显存读取速度远慢于计算芯片,导致芯片大量时间空转等待数据;网络拓扑中的任何一处瓶颈,在数万张卡的同步要求下,都会被急剧放大。
此外,Lambda等机构分析指出,显存压力、过度的激活重计算和张量并行带来的跨GPU通信开销等,都是拖累MFU的系统性因素。
值得注意的是,xAI 基建扩张堪称行业奇迹,其Colossus 超算仅 122天建成,GPU规模短时间内极速扩容,过快的硬件铺摊,也放大了软件优化滞后的致命短板。

对文章打分
马斯克的xAI坐拥55万张英伟达GPU加速卡 利用率仅11%
1 (50%) 1 (50%)- 登录
[退出]
最新资讯
加载中...编辑精选
加载中...热门评论
相关文章
-
黄仁勋反驳失业担忧论 称AI正在创造大量就业机会
- 17 分钟前
-
美媒披露OpenAI总裁庭审细节:300亿美元持股遭马斯克律师质疑
- 29 分钟前
-
在中国市场搞“付费订阅” 豆包咋想的?
- 半小时前
-
冲刺上市前夕 OpenAI曾商议分拆机器人与硬件业务部门
- 半小时前
-
豆包官宣收费 专家:所有大模型都会走向高阶付费模式
- 半小时前
Top 10
本周 本月-
1
IMDb的“逆天”发现:所有电影和电视剧都能免费看
阅读 (1060) 评论 (0) -
2
微信朋友圈悄悄更新了,你发现了吗?
阅读 (1048) 评论 (0) -
3
乘客买到高铁08车01C座 上车却懵了
阅读 (1033) 评论 (1) - 4中方对外资收购Manus项目作出安全审查决定
- 5央视揭秘中方为何禁止Meta收购Manus
- 6DeepSeek连夜删掉的新论文到底说了什么
- 7联想抛弃ThinkPad 20年经典设计:取消独立镁合金骨架
- 8ChatGPT助业余数学爱好者攻克60年埃尔德什差异问题
- 9苹果20周年版iPhone曝光:全新四曲面屏幕 打造物理液态玻璃效果
- 10触及红线被叫停 Meta数十亿收购Manus遭否决
-
1
《纽约时报》称已确认比特币发明者中本聪的真实身份
阅读 (5921) 评论 (0) -
2
苹果被曝下调 iPhone 18 规格以压缩成本
阅读 (2720) 评论 (0) -
3
苹果宣布CEO交接 蒂姆·库克发布致全球苹果用户公开信
阅读 (2108) 评论 (1) - 4GPT-6预计将于4月14日发布 性能暴增40%
- 5第一批学AI的大学生,已经笑不出来了
- 6《永劫无间》女解说黑衣黑脸反讽舆论 日本网友狂赞
- 7微软无预警封停 WireGuard 与 VeraCrypt 开发者账号
- 8陈冠希撞脸赵本山 网友感慨颜值断崖式下滑
- 9韩国Naver宣布全面弃用阿里Qwen编码器
- 10Claude复活30年前传奇游戏 仅用一个周末