Skip to content

2026-05-25

华为发布“韬定律”及逻辑折叠技术,通过三维拓扑重组提升芯片性能,不依赖新光刻工艺使麒麟芯片能效提升41%,未来将应用于昇腾AI芯片。 微软提出 NextLat 训练方法,在潜在空间进行自监督预测,为 Transformer 注入循环归纳偏置以构建紧凑世界模型,显著提升推理与规划能力,并实现 3.3 倍推理加速。 提出 Complete-muE 框架,攻克了 …

华为何庭波"韬定律"论文发布,逻辑折叠技术提升芯片性能 85

  • Tags: 芯片算力 半导体 硬件加速

  • Source: AI HOT 精选 | 阅读原文

[摘要]
华为发布“韬定律”及逻辑折叠技术,通过三维拓扑重组提升芯片性能,不依赖新光刻工艺使麒麟芯片能效提升41%,未来将应用于昇腾AI芯片。


Next-Latent Prediction Transformers Learn Compact World Models 85

  • Tags: 训练方法 世界模型 推理优化 Transformer

  • Source: arXiv Machine Learning | 阅读原文

[摘要]
微软提出 NextLat 训练方法,在潜在空间进行自监督预测,为 Transformer 注入循环归纳偏置以构建紧凑世界模型,显著提升推理与规划能力,并实现 3.3 倍推理加速。


Complete-muE: Optimal Hyperparameter Transfer and Scaling for MoE Models 85

  • Tags: 混合专家模型 超参数优化 大模型训练

  • Source: arXiv Machine Learning | 阅读原文

[摘要]
提出 Complete-muE 框架,攻克了 Dense 与 MoE 架构间超参数迁移的难题,实现“一次调整 Dense,迁移至所有 MoE”,显著降低 MoE 模型训练的超参数搜索成本。


Approaching I/O-optimality for Approximate Attention 85

  • Tags: 推理优化 注意力机制 算法理论

  • Source: arXiv Machine Learning | 阅读原文

[摘要]
提出一种近似注意力机制的I/O高效算法,将I/O复杂度从传统的二次方降低至近乎线性,接近I/O最优界限,有望大幅提升大模型长文本处理效率。


Same Model, Different Weakness: How Language and Modality Reshape the Jailbreak Attack Surface in Frontier MLLMs 85

  • Tags: AI安全 多模态大模型 越狱攻击 安全评估

  • Source: arXiv Computation and Language | 阅读原文

[摘要]
该研究系统评估了前沿多模态大模型在跨语言和跨模态下的越狱漏洞,发现语言与模态的交互会重塑安全攻击面,揭示了现有安全评估框架的局限性。


LLMs as Noisy Channels: A Shannon Perspective on Model Capacity and Scaling Laws 85

  • Tags: 大模型 Scaling Law 训练理论

  • Source: arXiv Artificial Intelligence | 阅读原文

[摘要]
该研究提出“香农缩放定律”(Shannon Scaling Law),将LLM训练建模为有噪信道传输,成功解释了过度训练和量化退化等非单调现象,并能准确预测更大模型的性能表现。


QED: An Open-Source Multi-Agent System for Generating Mathematical Proofs on Open Problems 85

  • Tags: AI for Science 多智能体 数学证明 开源工具

  • Source: arXiv Artificial Intelligence | 阅读原文

[摘要]
开源多智能体系统 QED 可自主将研究问题转化为完整数学证明。其采用规划、证明与验证分离的架构,已在代数几何等领域产出 5 篇达到专业期刊水平的原创数学研究。


The Deterministic Horizon: Impossibility Results as Design Specifications for Trustworthy AI Systems 85

  • Tags: 模型架构 AI安全 可信AI

  • Source: arXiv Artificial Intelligence | 阅读原文

[摘要]
证明了Transformer架构存在由层数和嵌入宽度决定的推理深度上限(确定性地平线),超越该上限后任何训练均无法提升准确率,为可信AI系统设计提供了可计算的边界与设计规范。


SkillOpt: Executive Strategy for Self-Evolving Agent Skills 85

  • Tags: AI智能体 提示词工程 模型优化

  • Source: arXiv Artificial Intelligence | 阅读原文

[摘要]
提出SkillOpt,首个系统性、可控的智能体技能文本空间优化器。它通过类似深度学习优化的机制自动编辑和迭代智能体技能,在多项基准上显著提升性能且不增加推理成本。


Inductive Deductive Synthesis: Enabling AI to Generate Formally Verified Systems 85

  • Tags: 代码生成 形式化验证 AI Agent

  • Source: arXiv Artificial Intelligence | 阅读原文

[摘要]
研究者提出归纳演绎合成(IDS)框架,通过联合增量合成代码与证明,使 AI Agent 能够自动生成并形式化验证复杂的分布式系统,效率比人类专家提升200倍。