AI & ML 2026-3-26
B200加速深度模型训练,MXFP8与DeepEP实现41%性能提升;AI工厂助力电网稳定;开源与专有并行发展成主流趋势;Lyria 3 Pro拓展生成能力边界。
Enabling Up to 41% Faster Pre-training: MXFP8 and DeepEP for DeepSeek-V3 on B200 with TorchTitan 94
Tags:
大模型Mixture-of-ExpertsMXFP8DeepEPTorchTitanGPU优化Source:
Pytorch_Blog| 阅读原文
[摘要]
首次在NVIDIA B200集群上实现DeepSeek-V3 MoE模型的高效训练,结合MXFP8计算与DeepEP通信优化,实现高达41%的吞吐量提升,且无损失收敛性。
Blowing Off Steam: How Power-Flexible AI Factories Can Stabilize the Global Energy Grid 92
Tags:
AI for EnergyPower-Flexible AIGrid StabilityNVIDIAEmerald AISmart GridSource:
NVIDIA_Blog| 阅读原文
[摘要]
提出“电力柔性”AI工厂通过动态调节算力负载,缓解电网峰值压力,实现与电网协同优化,为大规模AI部署提供可持续能源解决方案。
The Future of AI Is Open and Proprietary 85
Tags:
大模型开源AI模型协作系统级AI行业专用模型Source:
NVIDIA_Blog| 阅读原文
[摘要]
NVIDIA推动开放前沿模型生态,通过Nemotron Coalition构建协作式多模型系统,支持跨行业、多模态AI的定制化与持续进化。
Lyria 3 Pro: Create longer tracks in more 85
Tags:
大模型音乐生成AI创作工具多模态生成Source:
DeepMind| 阅读原文
[摘要]
Lyria 3 Pro 推出长时音乐生成与结构化创作能力,支持3分钟以上定制化音乐生成,并集成至Vertex AI、Gemini、Google Vids等多产品,提升AI音乐在创意产业中的实用性与可控性。