Skip to content

AI & ML 2026-3-13

MXFP8训练实现1.3倍速度提升,NVIDIA AI-Q登顶DeepResearch榜单,工业AI与数字孪生加速制造革新,GeForce NOW亮相GDC再掀云游戏热潮。

MXFP8 Training for MoEs: 1.3x training speedup vs BF16 for Llama4 Scout on GB200 cluster using TorchAO and TorchTitan 92

  • Tags: 大模型 MoE 低精度训练 MXFP8 TorchAO GEMM优化

  • Source: Pytorch_Blog | 阅读原文

[摘要]
通过在TorchAO中使用动态MXFP8分组GEMM实现Llama4 Scout训练速度提升30.2%,达到理论峰值的81%,且收敛性与bfloat16相当,显著提升大规模MoE模型训练效率。


How NVIDIA AI-Q Reached #1 on DeepResearch Bench I and II 92

  • Tags: 大模型 多智能体系统 开源AI 深度研究代理 NVIDIA NeMo

  • Source: HuggingFace | 阅读原文

[摘要]
NVIDIA AI-Q通过模块化多代理架构与可配置开源设计,在DeepResearch Bench I和II上取得双冠,实现高精度信息检索、深度分析与高质量报告生成。


Into the Omniverse: How Industrial AI and Digital Twins Accelerate Design, Engineering and Manufacturing Across Industries 87

  • Tags: 数字孪生 AI物理 工业AI 虚拟孪生 大模型 仿真优化

  • Source: NVIDIA_Blog | 阅读原文

[摘要]
NVIDIA与达索系统合作,融合AI物理模型与数字孪生技术,实现工业级虚拟仿真加速,推动跨行业产品设计与可持续创新。


GeForce NOW Raises the Game at the Game Developers Conference 85

  • Tags: 、VR流媒体提升至90fps、GOG账号同步及新游戏上线,显著增强云游戏可发现性与体验流畅度。

  • Source: NVIDIA_Blog | 阅读原文

[摘要]
GeForce NOW在GDC发布多项更新,包括订阅账户联动标签、VR流媒体提升至90fps、GOG账号同步及新游戏上线,显著增强云游戏可发现性与体验流畅度。