每秒110万个token!微软(MSFT.US)和英伟达(NVDA.US)联手刷新AI推理纪录
对此,Signal65的实验室副总裁拉斯・费洛斯指出:"这一里程碑不仅突破了每秒百万token的障碍,还在 一个能够满足现代企业动态使用和数据治理需求的平台上实现。" 他补充称,Azure ND GB300相较于上 一代NVIDIA GB200在推理性能上提升了27%,而仅增加了17%的功率规格。 微软(MSFT.US)宣布,其Azure ND GB300v6虚拟机在Meta的Llama270B模型上实现了每秒推理速度达 110万token的行业新纪录。据悉,Azure ND GB300虚拟机采用英伟达(NVDA.US)的Blackwell Ultra GPU,具体为NVIDIA GB300NVL72系统,配置72个NVIDIA Blackwell Ultra GPU和36个NVIDIA Grace CPU,采用单机架构设计。这款虚拟机专为推理工作负载优化,具有50%的GPU内存提升和16%的热设 计功率(TDP)提高。 微软首席执行官萨提亚・纳德拉在社交媒体上表示:"这一成就是我们与英伟达长期合作和在生产规模运 行人工智能方面专业知识的结晶。" 资料显示,为了验证性能提升,微软在一个NVIDIA GB300 ...