2026-05-25
华为发布“韬定律”及逻辑折叠技术,通过三维拓扑重组提升芯片性能,不依赖新光刻工艺使麒麟芯片能效提升41%,未来将应用于昇腾AI芯片。 微软提出 NextLat 训练方法,在潜在空间进行自监督预测,为 Transformer 注入循环归纳偏置以构建紧凑世界模型,显著提升推理与规划能力,并实现 3.3 倍推理加速。 提出 Complete-muE 框架,攻克了 …
华为何庭波"韬定律"论文发布,逻辑折叠技术提升芯片性能 85
Tags:
芯片算力半导体硬件加速Source:
AI HOT 精选| 阅读原文
[摘要]
华为发布“韬定律”及逻辑折叠技术,通过三维拓扑重组提升芯片性能,不依赖新光刻工艺使麒麟芯片能效提升41%,未来将应用于昇腾AI芯片。
Next-Latent Prediction Transformers Learn Compact World Models 85
Tags:
训练方法世界模型推理优化TransformerSource:
arXiv Machine Learning| 阅读原文
[摘要]
微软提出 NextLat 训练方法,在潜在空间进行自监督预测,为 Transformer 注入循环归纳偏置以构建紧凑世界模型,显著提升推理与规划能力,并实现 3.3 倍推理加速。
Complete-muE: Optimal Hyperparameter Transfer and Scaling for MoE Models 85
Tags:
混合专家模型超参数优化大模型训练Source:
arXiv Machine Learning| 阅读原文
[摘要]
提出 Complete-muE 框架,攻克了 Dense 与 MoE 架构间超参数迁移的难题,实现“一次调整 Dense,迁移至所有 MoE”,显著降低 MoE 模型训练的超参数搜索成本。
Approaching I/O-optimality for Approximate Attention 85
Tags:
推理优化注意力机制算法理论Source:
arXiv Machine Learning| 阅读原文
[摘要]
提出一种近似注意力机制的I/O高效算法,将I/O复杂度从传统的二次方降低至近乎线性,接近I/O最优界限,有望大幅提升大模型长文本处理效率。
Same Model, Different Weakness: How Language and Modality Reshape the Jailbreak Attack Surface in Frontier MLLMs 85
Tags:
AI安全多模态大模型越狱攻击安全评估Source:
arXiv Computation and Language| 阅读原文
[摘要]
该研究系统评估了前沿多模态大模型在跨语言和跨模态下的越狱漏洞,发现语言与模态的交互会重塑安全攻击面,揭示了现有安全评估框架的局限性。
LLMs as Noisy Channels: A Shannon Perspective on Model Capacity and Scaling Laws 85
Tags:
大模型Scaling Law训练理论Source:
arXiv Artificial Intelligence| 阅读原文
[摘要]
该研究提出“香农缩放定律”(Shannon Scaling Law),将LLM训练建模为有噪信道传输,成功解释了过度训练和量化退化等非单调现象,并能准确预测更大模型的性能表现。
QED: An Open-Source Multi-Agent System for Generating Mathematical Proofs on Open Problems 85
Tags:
AI for Science多智能体数学证明开源工具Source:
arXiv Artificial Intelligence| 阅读原文
[摘要]
开源多智能体系统 QED 可自主将研究问题转化为完整数学证明。其采用规划、证明与验证分离的架构,已在代数几何等领域产出 5 篇达到专业期刊水平的原创数学研究。
The Deterministic Horizon: Impossibility Results as Design Specifications for Trustworthy AI Systems 85
Tags:
模型架构AI安全可信AISource:
arXiv Artificial Intelligence| 阅读原文
[摘要]
证明了Transformer架构存在由层数和嵌入宽度决定的推理深度上限(确定性地平线),超越该上限后任何训练均无法提升准确率,为可信AI系统设计提供了可计算的边界与设计规范。
SkillOpt: Executive Strategy for Self-Evolving Agent Skills 85
Tags:
AI智能体提示词工程模型优化Source:
arXiv Artificial Intelligence| 阅读原文
[摘要]
提出SkillOpt,首个系统性、可控的智能体技能文本空间优化器。它通过类似深度学习优化的机制自动编辑和迭代智能体技能,在多项基准上显著提升性能且不增加推理成本。
Inductive Deductive Synthesis: Enabling AI to Generate Formally Verified Systems 85
Tags:
代码生成形式化验证AI AgentSource:
arXiv Artificial Intelligence| 阅读原文
[摘要]
研究者提出归纳演绎合成(IDS)框架,通过联合增量合成代码与证明,使 AI Agent 能够自动生成并形式化验证复杂的分布式系统,效率比人类专家提升200倍。