快科技6月17日消息,MLCommons发布了MLPerf Training 6.0基准测试最新结果,英伟达Blackwell平台在全部7项基准测试中拿下最快训练成绩,并成为唯一覆盖全部测试项目的平台。

MLPerf Training是业界广泛使用的AI训练基准测试体系,用于比较不同硬件在模型训练任务中的速度和效率。

英伟达提交了GB200 NVL72和GB300 NVL72两套机架级系统,每套NVL72内部通过第5代NVLink Switch连接72块GPU,将算力和内存整合成统一资源池。

MLPerf 6.0训练榜单公布:英伟达Blackwell包揽全部7项第一

在性能层面,GB300 NVL72较GB200 NVL72在同等规模下最高可带来1.6倍训练速度提升,关键驱动力包括NVFP4带来的更高计算密度、更大内存容量以及更高的功耗上限。

在规模层面,英伟达将Blackwell训练集群扩展至8192块GPU,在DeepSeek-V3 671B任务上完成大规模提交,成为MLPerf Training迄今规模最大的Blackwell成绩。

CoreWeave借助采用Spectrum-X以太网的GB300 NVL72系统,在8192块GPU规模上将DeepSeek-V3 671B训练到目标质量,耗时仅2.02分钟。

MLPerf 6.0训练榜单公布:英伟达Blackwell包揽全部7项第一

微软Azure用GB200 NVL72将Llama 3.1 405B扩展到8192块GPU,7.07分钟达成参考质量目标。

本次测试共24家机构提交了95份结果,英伟达平台在性能、规模和可靠性三项指标上均处于领先。

MLPerf 6.0训练榜单公布:英伟达Blackwell包揽全部7项第一

值得一提的是,MLPerf Training 6.0新增了DeepSeek-V3 671B和GPT-OSS-20B两个混合专家模型预训练工作负载,反映MoE架构在AI领域的日益重要。

MLPerf 6.0训练榜单公布:英伟达Blackwell包揽全部7项第一

本文转自:凤凰网科技

原文地址: https://tech.ifeng.com/c/8u2Edsg7tkz