2026-06-05
Neolab 发布 Nex-N2-Pro,基于 Qwen3.5 的 397B MoE 推理模型,性能达到 GPT-5.5 级别,支持多模态与自适应推理深度,降低 token 消耗并取得多项 SOTA。 微软与OpenAI合作关系彻底破裂,双方转为正面竞争。微软AI主管Mustafa Suleyman表示将独立证明能力,标志两大AI巨头从合作走向对抗,深刻影响…
Nex-N2-Pro 发布:基于 Qwen3.5 的 397B MoE 推理模型,性能达 GPT-5.5 水平 95
Tags:
模型发布大模型推理优化智能体Source:
AI HOT 精选| 阅读原文
[摘要]
Neolab 发布 Nex-N2-Pro,基于 Qwen3.5 的 397B MoE 推理模型,性能达到 GPT-5.5 级别,支持多模态与自适应推理深度,降低 token 消耗并取得多项 SOTA。
微软与OpenAI分道扬镳--如今双方准备正面交锋 90
Tags:
公司动态AI产业格局Source:
AI HOT 精选| 阅读原文
[摘要]
微软与OpenAI合作关系彻底破裂,双方转为正面竞争。微软AI主管Mustafa Suleyman表示将独立证明能力,标志两大AI巨头从合作走向对抗,深刻影响行业格局。
OpenAI称AI递归自我改进迹象初现 85
Tags:
AI安全公司动态政策监管Source:
AI HOT 精选| 阅读原文
[摘要]
OpenAI指出AI递归自我改进迹象初现,AI开发正被自身加速,将加剧竞争与治理挑战,提示行业重大趋势变化。
Meet OpenJarvis:一个本地优先的设备端个人AI智能体框架,支持工具、记忆与学习 85
Tags:
开源生态智能体模型发布推理优化Source:
AI HOT 精选| 阅读原文
[摘要]
Stanford发布OpenJarvis,一个本地优先的设备端AI智能体框架,支持工具、记忆与学习,性能接近云端模型,API成本降低约800倍。
黄仁勋与纳德拉共议智能体AI时代 85
Tags:
公司动态智能体AI生态Source:
AI HOT 精选| 阅读原文
[摘要]
黄仁勋与纳德拉在MSBuild共议智能体AI时代,展示NVIDIA与微软从Windows设备到规模化AI工厂的协作,标志智能体AI生态重要进展。
NVIDIA Research 在 CVPR 2026 发表三篇论文:规模化训练实现抓取、自动驾驶与智能体泛化 85
Tags:
模型发布机器人自动驾驶开源生态Source:
AI HOT 精选| 阅读原文
[摘要]
NVIDIA Research在CVPR 2026发表三篇论文:零样本抓取基础模型GraspGen-X、自动驾驶紧凑推理LCDrive以及具身智能体泛化NitroGen,并开源curoboV2等库,推动机器人、自动驾驶和具身智能泛化能力。
In-Context Graphical Inference 85
Tags:
图模型推理优化TransformerSource:
arXiv Computation and Language| 阅读原文
[摘要]
提出ICG-I,一种自回归图Transformer,通过模仿变量消除并采用张量列压缩进行图推断,在标准实例和受挫自旋玻璃上实现SOTA性能。
Adaptive Information Control for Search-Augmented LLM Reasoning 85
Tags:
推理优化RAG大模型智能体Source:
arXiv Computation and Language| 阅读原文
[摘要]
提出DeepControl框架,通过信息效用自适应控制检索的进行与粒度,解决搜索增强LLM推理中的冗余与不稳定问题,在7个基准上平均优于Search-R1达9.4分。
Martingale Neural Operators: Learning Stochastic Marginals via Doob-Meyer Factorization 83
Tags:
研究进展AI科学计算神经网络算子不确定性量化Source:
arXiv Machine Learning| 阅读原文
[摘要]
提出 Martingale Neural Operator,将 Doob-Meyer 定理引入神经算子架构,同时预测随机偏微分方程的均值和协方差,显著提升 Wasserstein 距离并加速推理,对科学计算与不确定性量化有重要价值。
Boson AI 与 LMSYS 发布基于 SGLang-Omni 的 Higgs Audio v3 TTS 端到端服务 82
Tags:
模型发布语音生成推理优化Source:
AI HOT 精选| 阅读原文
[摘要]
Boson AI与LMSYS联合发布基于SGLang-Omni的Higgs Audio v3 TTS服务,4B参数,支持100+语言、零样本语音克隆及20+情感控制,实现低延迟流式合成。
Depth-Attention: Cross-Layer Value Mixing for Language Models 82
Tags:
研究模型优化注意力机制Source:
arXiv Computation and Language| 阅读原文
[摘要]
提出Depth-Attention,在注意力模块内实现跨层值混合,无需额外参数或推理状态,1.5B-3B模型上困惑度与下游精度均优于基线,为语言模型提供高效改进。
Hint Tuning: Less Data Makes Better Reasoners 82
Tags:
推理优化模型发布大模型Source:
arXiv Computation and Language| 阅读原文
[摘要]
提出 Hint Tuning 方法,仅用1000样本即可显著减少大推理模型推理 token 数(平均31.5%),同时维持准确率,提升推理效率。
Emergent Ordinal Geometry in Transformers Trained on Local Comparisons 82
Tags:
大模型推理认知科学研究进展Source:
arXiv Artificial Intelligence| 阅读原文
[摘要]
研究发现Transformer仅通过局部比较训练即可涌现一维序数几何结构,其排序主轴精确恢复隐藏全序,并复现人类符号距离效应,为跨物种传递推理提供了神经几何解释。
RobotValues: Evaluating Household Robots When Human Values Conflict 82
Tags:
智能体AI安全模型发布多模态Source:
arXiv Artificial Intelligence| 阅读原文
[摘要]
新基准RobotValues评估家用机器人在价值冲突场景中的行为,发现VLM模型默认偏好安全与包容,但难以按指令调整价值观,80%场景选错动作,对机器人价值对齐研究有重要意义。
Code-on-Graph: Iterative Programmatic Reasoning via Large Language Models on Knowledge Graphs 82
Tags:
LLM知识图谱推理研究进展Source:
arXiv Artificial Intelligence| 阅读原文
[摘要]
提出Code-on-Graph框架,通过代码生成与知识图谱模式实现灵活编程推理,避免直接注入大规模事实,在三个KG问答基准上超越前SOTA达10.5%。
Entropy Is Not Enough: Unlocking Effective Reinforcement Learning for Visual Reasoning via Vision-Anchored Token Selection 82
Tags:
多模态强化学习推理优化训练方法Source:
arXiv Artificial Intelligence| 阅读原文
[摘要]
VEPO提出视觉锚定 token 选择机制,解决视觉推理中熵无效问题,显著提升多模态 RL 性能(7B 模型提升 2.28 点)。
Towards a Science of AI Agent Reliability 82
Tags:
AI安全智能体模型评估Source:
arXiv Machine Learning| 阅读原文
[摘要]
提出12个指标系统衡量AI Agent可靠性(一致性、鲁棒性、可预测性、安全性),评估15个模型发现能力提升对可靠性改善很小,为安全部署提供新评估框架。
Qwen-Image-Flash: Beyond Objective Design 82
Tags:
图像生成模型蒸馏训练策略推理加速Source:
arXiv Machine Learning| 阅读原文
[摘要]
提出基于训练配方优化的少步蒸馏方法,通过调整数据构成、教师引导与任务混合加速视觉生成模型,发布Qwen-Image-Flash。
P\textsuperscript{2}-DPO: Grounding Hallucination in Perceptual Processing via Calibration Direct Preference Optimization 82
Tags:
多模态大模型训练方法幻觉缓解DPO优化Source:
arXiv Machine Learning| 阅读原文
[摘要]
提出P²-DPO训练范式,通过自生成偏好对与校准损失优化多模态大模型感知瓶颈与视觉鲁棒性,有效缓解幻觉且降低人工反馈成本。
Patcher: Post-Hoc Patching of Backdoored Large Language Models 82
Tags:
大模型安全后门防御对抗鲁棒性Source:
arXiv Machine Learning| 阅读原文
[摘要]
提出Patcher框架,仅凭单条失败案例即可定位并修复大语言模型的后门攻击,在保持模型性能的同时有效抵御自适应攻击。