xAI计划部署5000万颗AI GPU
来源:陈超月 发布时间:2 天前 分享至微信
美国人工智能初创企业xAI的CEO埃隆·马斯克宣布,公司计划在未来五年内部署相当于5000万颗英伟达H100等级的AI GPU。

目前,xAI已经部署了最新的AI GPU加速器,以提高其AI训练能力。其Colossus 1超级集群使用了20万个基于Hopper架构的英伟达H100和H200加速器,以及3万个基于Blackwell架构的GB200加速器。此外,xAI计划构建由55万个GB200和GB300节点组成的Colossus 2集群,该集群将配备超过100万个GPU。据马斯克透露,第一批节点将在未来几周内上线。


英伟达及其他公司正通过每年更新AI加速器的节奏,持续提升产品性能。例如,Blackwell B200的推理性能比2016年的Pascal P100提高了20000倍。英伟达声称,Blackwell的能源效率也比Pascal高出42500倍。此外,Blackwell Ultra架构在人工智能推理方面的FP4性能比原始Blackwell GPU高出50%,在人工智能训练方面的BF16和TF32格式性能高出两倍。


然而,随着算力的提升,能耗问题也愈发突出。一个H100 AI加速器的功耗约为700W,5000万个处理器将消耗35吉瓦电力,相当于35座核电站的发电量。即使采用更高效的Feynman架构,50 ExaFLOPS集群仍需4.685吉瓦电力,远超Colossus 2数据中心的1.4-1.96吉瓦需求。这一能耗挑战将对美国的能源基础设施提出严峻考验。

[ 新闻来源:陈超月,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
存入云盘 收藏
举报
全部评论

暂无评论哦,快来评论一下吧!