Skip to content

AI & ML 2026-3-26

B200加速深度模型训练,MXFP8与DeepEP实现41%性能提升;AI工厂助力电网稳定;开源与专有并行发展成主流趋势;Lyria 3 Pro拓展生成能力边界。

Enabling Up to 41% Faster Pre-training: MXFP8 and DeepEP for DeepSeek-V3 on B200 with TorchTitan 94

  • Tags: 大模型 Mixture-of-Experts MXFP8 DeepEP TorchTitan GPU优化

  • Source: Pytorch_Blog | 阅读原文

[摘要]
首次在NVIDIA B200集群上实现DeepSeek-V3 MoE模型的高效训练,结合MXFP8计算与DeepEP通信优化,实现高达41%的吞吐量提升,且无损失收敛性。


Blowing Off Steam: How Power-Flexible AI Factories Can Stabilize the Global Energy Grid 92

  • Tags: AI for Energy Power-Flexible AI Grid Stability NVIDIA Emerald AI Smart Grid

  • Source: NVIDIA_Blog | 阅读原文

[摘要]
提出“电力柔性”AI工厂通过动态调节算力负载,缓解电网峰值压力,实现与电网协同优化,为大规模AI部署提供可持续能源解决方案。


The Future of AI Is Open and Proprietary 85

  • Tags: 大模型 开源AI 模型协作 系统级AI 行业专用模型

  • Source: NVIDIA_Blog | 阅读原文

[摘要]
NVIDIA推动开放前沿模型生态,通过Nemotron Coalition构建协作式多模型系统,支持跨行业、多模态AI的定制化与持续进化。


Lyria 3 Pro: Create longer tracks in more 85

  • Tags: 大模型 音乐生成 AI创作工具 多模态生成

  • Source: DeepMind | 阅读原文

[摘要]
Lyria 3 Pro 推出长时音乐生成与结构化创作能力,支持3分钟以上定制化音乐生成,并集成至Vertex AI、Gemini、Google Vids等多产品,提升AI音乐在创意产业中的实用性与可控性。