Skip to content

AI & ML 2026-3-10

AI与机器学习领域持续突破:从长序列训练到边缘语音模型,再到工业级物理AI落地,技术正全面加速。PyTorch携手NVIDIA GTC 2026,共探下一代智能引擎。

LeRobot v0.5.0: Scaling Every Dimension 92

  • Tags: 机器人学习 多模态模型 人形机器人 强化学习 模拟环境 Hugging Face Hub

  • Source: HuggingFace | 阅读原文

[摘要]
LeRobot v0.5.0实现多维度扩展,首次支持Unitree G1人形机器人全身体控,引入自回归VLAs与实时分块推理策略,集成EnvHub与NVIDIA IsaacLab-Arena,代码全面升级至Python 3.12+与Transformers v5。


Ulysses Sequence Parallelism: Training with Million-Token Contexts 92

  • Tags: 大模型 长序列训练 序列并行 注意力机制 分布式训练

  • Source: HuggingFace | 阅读原文

[摘要]
Ulysses Sequence Parallelism实现百万级token上下文训练,通过注意力头并行突破GPU内存限制,显著提升长序列建模能力。


ABB Robotics Taps NVIDIA Omniverse to Deliver Industrial‑Grade Physical AI at Scale 88

  • Tags: 工业AI 物理仿真 仿真到现实 机器人自动化 合成数据 大模型应用

  • Source: NVIDIA_Blog | 阅读原文

[摘要]
将NVIDIA Omniverse物理仿真与ABB RobotStudio深度集成,实现高精度、可迁移的工业机器人虚拟验证与AI训练,显著缩小“仿真到现实”差距。


Granite 4.0 1B Speech: Compact, Multilingual, and Built for the Edge 87

  • Tags: 语音识别 多语言模型 边缘AI 小模型 Apache 2.0开源

  • Source: HuggingFace | 阅读原文

[摘要]
Granite 4.0 1B Speech 是一款轻量级、多语言语音识别与双向语音翻译模型,参数量减半却实现更高准确率与更快推理,支持英、法、德、西、葡、日语及关键词偏置,适用于边缘计算场景。


LongCat 为 OpenClaw 装上效率引擎:你的自动化任务还能再快 30% 87

  • Tags: AI Agent 本地化大模型 自动化工作流 多模态工具调用 系统级控制

  • Source: Meituan_Tech | 阅读原文

[摘要]
LongCat-Flash-Thinking-2601 通过高效的任务分解与跨工具协同,在本地化 AI Agent 场景中实现端到端自动化,显著提升复杂任务执行速度与系统级操作可靠性。


PyTorch at NVIDIA GTC 2026: Join Us in San Jose! 85

  • Tags: PyTorch 高性能计算 自定义内核 边缘推理 分布式训练

  • Source: Pytorch_Blog | 阅读原文

[摘要]
PyTorch在NVIDIA GTC 2026展示其在高性能AI中的核心进展,包括Helion自定义内核框架、ExecuTorch边缘推理部署及分布式训练技术演进。


How AI Is Driving Revenue, Cutting Costs and Boosting Productivity for Every Industry in 2026 85

  • Tags: 企业AI 开源AI 人工智能商业化 ROI 产业应用

  • Source: NVIDIA_Blog | 阅读原文

[摘要]
企业AI应用进入规模化部署阶段,开源驱动技术落地,推动各行业营收增长与成本下降,但人才短缺仍是主要挑战。