2026-03-13

MXFP8训练实现1.3倍速度提升，NVIDIA AI-Q登顶DeepResearch榜单，工业AI与数字孪生加速制造革新，GeForce NOW亮相GDC再掀云游戏热潮。

MXFP8 Training for MoEs: 1.3x training speedup vs BF16 for Llama4 Scout on GB200 cluster using TorchAO and TorchTitan 92

[摘要]
通过在TorchAO中使用动态MXFP8分组GEMM实现Llama4 Scout训练速度提升30.2%，达到理论峰值的81%，且收敛性与bfloat16相当，显著提升大规模MoE模型训练效率。

[摘要]
NVIDIA AI-Q通过模块化多代理架构与可配置开源设计，在DeepResearch Bench I和II上取得双冠，实现高精度信息检索、深度分析与高质量报告生成。

[摘要]
NVIDIA与达索系统合作，融合AI物理模型与数字孪生技术，实现工业级虚拟仿真加速，推动跨行业产品设计与可持续创新。

[摘要]
GeForce NOW在GDC发布多项更新，包括订阅账户联动标签、VR流媒体提升至90fps、GOG账号同步及新游戏上线，显著增强云游戏可发现性与体验流畅度。