AI & ML 2026-3-13
MXFP8训练实现1.3倍速度提升,NVIDIA AI-Q登顶DeepResearch榜单,工业AI与数字孪生加速制造革新,GeForce NOW亮相GDC再掀云游戏热潮。
MXFP8 Training for MoEs: 1.3x training speedup vs BF16 for Llama4 Scout on GB200 cluster using TorchAO and TorchTitan 92
Tags:
大模型MoE低精度训练MXFP8TorchAOGEMM优化Source:
Pytorch_Blog| 阅读原文
[摘要]
通过在TorchAO中使用动态MXFP8分组GEMM实现Llama4 Scout训练速度提升30.2%,达到理论峰值的81%,且收敛性与bfloat16相当,显著提升大规模MoE模型训练效率。
How NVIDIA AI-Q Reached #1 on DeepResearch Bench I and II 92
Tags:
大模型多智能体系统开源AI深度研究代理NVIDIA NeMoSource:
HuggingFace| 阅读原文
[摘要]
NVIDIA AI-Q通过模块化多代理架构与可配置开源设计,在DeepResearch Bench I和II上取得双冠,实现高精度信息检索、深度分析与高质量报告生成。
Into the Omniverse: How Industrial AI and Digital Twins Accelerate Design, Engineering and Manufacturing Across Industries 87
Tags:
数字孪生AI物理工业AI虚拟孪生大模型仿真优化Source:
NVIDIA_Blog| 阅读原文
[摘要]
NVIDIA与达索系统合作,融合AI物理模型与数字孪生技术,实现工业级虚拟仿真加速,推动跨行业产品设计与可持续创新。
GeForce NOW Raises the Game at the Game Developers Conference 85
Tags:
、VR流媒体提升至90fps、GOG账号同步及新游戏上线,显著增强云游戏可发现性与体验流畅度。Source:
NVIDIA_Blog| 阅读原文
[摘要]
GeForce NOW在GDC发布多项更新,包括订阅账户联动标签、VR流媒体提升至90fps、GOG账号同步及新游戏上线,显著增强云游戏可发现性与体验流畅度。