Skip to content

AI & ML 2026-4-1

AI前沿动态:TRL v1.0推动训练后优化发展,NVIDIA携手能源企业打造柔性AI工厂以提升电网韧性,Meta发布Granite 4.0 3B视觉模型,助力企业文档智能处理。

TRL v1.0: Post-Training Library Built to Move with the Field 92

  • Tags: Post-Training Reinforcement Learning Library Design Evolving Framework

  • Source: HuggingFace | 阅读原文

[摘要]
TRL v1.0 构建了一个高度适应性、可扩展的后训练方法库,通过演化式设计应对AI后训练范式的快速迭代,实现对75+方法的高效集成与实践支持。


Efficiency at Scale: NVIDIA, Energy Leaders Accelerating Power‑Flexible AI Factories to Fortify the Grid 92

  • Tags: AI工厂 能源-算力协同 电力系统韧性 极致软硬协同设计 tokens per second per watt

  • Source: NVIDIA_Blog | 阅读原文

[摘要]
提出将AI工厂作为动态可调的智能电网资产,通过软硬件协同设计实现算力与能源的实时优化,显著提升每瓦特生成令牌数,推动能源-算力一体化新范式。


Granite 4.0 3B Vision: Compact Multimodal Intelligence for Enterprise Documents 92

  • Tags: 多模态大模型 图表理解 数据增强 LoRA 企业文档处理 DeepStack

  • Source: HuggingFace | 阅读原文

[摘要]
基于代码引导数据增强构建百万级图表理解数据集ChartNet,提出新型DeepStack架构与模块化LoRA设计,实现企业文档中表格、图表与语义键值对的高精度多模态解析。