2026-06-05

Neolab 发布 Nex-N2-Pro，基于 Qwen3.5 的 397B MoE 推理模型，性能达到 GPT-5.5 级别，支持多模态与自适应推理深度，降低 token 消耗并取得多项 SOTA。微软与OpenAI合作关系彻底破裂，双方转为正面竞争。微软AI主管Mustafa Suleyman表示将独立证明能力，标志两大AI巨头从合作走向对抗，深刻影响…

Nex-N2-Pro 发布：基于 Qwen3.5 的 397B MoE 推理模型，性能达 GPT-5.5 水平 95

Tags: 模型发布 大模型 推理优化 智能体
Source: AI HOT 精选 | 阅读原文

[摘要]
Neolab 发布 Nex-N2-Pro，基于 Qwen3.5 的 397B MoE 推理模型，性能达到 GPT-5.5 级别，支持多模态与自适应推理深度，降低 token 消耗并取得多项 SOTA。

微软与OpenAI分道扬镳--如今双方准备正面交锋 90

Tags: 公司动态 AI产业格局
Source: AI HOT 精选 | 阅读原文

[摘要]
微软与OpenAI合作关系彻底破裂，双方转为正面竞争。微软AI主管Mustafa Suleyman表示将独立证明能力，标志两大AI巨头从合作走向对抗，深刻影响行业格局。

OpenAI称AI递归自我改进迹象初现 85

Tags: AI安全 公司动态 政策监管
Source: AI HOT 精选 | 阅读原文

[摘要]
OpenAI指出AI递归自我改进迹象初现，AI开发正被自身加速，将加剧竞争与治理挑战，提示行业重大趋势变化。

Meet OpenJarvis：一个本地优先的设备端个人AI智能体框架，支持工具、记忆与学习 85

Tags: 开源生态 智能体 模型发布 推理优化
Source: AI HOT 精选 | 阅读原文

[摘要]
Stanford发布OpenJarvis，一个本地优先的设备端AI智能体框架，支持工具、记忆与学习，性能接近云端模型，API成本降低约800倍。

黄仁勋与纳德拉共议智能体AI时代 85

Tags: 公司动态 智能体 AI生态
Source: AI HOT 精选 | 阅读原文

[摘要]
黄仁勋与纳德拉在MSBuild共议智能体AI时代，展示NVIDIA与微软从Windows设备到规模化AI工厂的协作，标志智能体AI生态重要进展。

NVIDIA Research 在 CVPR 2026 发表三篇论文：规模化训练实现抓取、自动驾驶与智能体泛化 85

Tags: 模型发布 机器人 自动驾驶 开源生态
Source: AI HOT 精选 | 阅读原文

[摘要]
NVIDIA Research在CVPR 2026发表三篇论文：零样本抓取基础模型GraspGen-X、自动驾驶紧凑推理LCDrive以及具身智能体泛化NitroGen，并开源curoboV2等库，推动机器人、自动驾驶和具身智能泛化能力。

In-Context Graphical Inference 85

Tags: 图模型 推理优化 Transformer
Source: arXiv Computation and Language | 阅读原文

[摘要]
提出ICG-I，一种自回归图Transformer，通过模仿变量消除并采用张量列压缩进行图推断，在标准实例和受挫自旋玻璃上实现SOTA性能。

Adaptive Information Control for Search-Augmented LLM Reasoning 85

Tags: 推理优化 RAG 大模型 智能体
Source: arXiv Computation and Language | 阅读原文

[摘要]
提出DeepControl框架，通过信息效用自适应控制检索的进行与粒度，解决搜索增强LLM推理中的冗余与不稳定问题，在7个基准上平均优于Search-R1达9.4分。

Martingale Neural Operators: Learning Stochastic Marginals via Doob-Meyer Factorization 83

Tags: 研究进展 AI科学计算 神经网络算子 不确定性量化
Source: arXiv Machine Learning | 阅读原文

[摘要]
提出 Martingale Neural Operator，将 Doob-Meyer 定理引入神经算子架构，同时预测随机偏微分方程的均值和协方差，显著提升 Wasserstein 距离并加速推理，对科学计算与不确定性量化有重要价值。

Boson AI 与 LMSYS 发布基于 SGLang-Omni 的 Higgs Audio v3 TTS 端到端服务 82

Tags: 模型发布 语音生成 推理优化
Source: AI HOT 精选 | 阅读原文

[摘要]
Boson AI与LMSYS联合发布基于SGLang-Omni的Higgs Audio v3 TTS服务，4B参数，支持100+语言、零样本语音克隆及20+情感控制，实现低延迟流式合成。

Depth-Attention: Cross-Layer Value Mixing for Language Models 82

Tags: 研究 模型优化 注意力机制
Source: arXiv Computation and Language | 阅读原文

[摘要]
提出Depth-Attention，在注意力模块内实现跨层值混合，无需额外参数或推理状态，1.5B-3B模型上困惑度与下游精度均优于基线，为语言模型提供高效改进。

Hint Tuning: Less Data Makes Better Reasoners 82

Tags: 推理优化 模型发布 大模型
Source: arXiv Computation and Language | 阅读原文

[摘要]
提出 Hint Tuning 方法，仅用1000样本即可显著减少大推理模型推理 token 数（平均31.5%），同时维持准确率，提升推理效率。

Emergent Ordinal Geometry in Transformers Trained on Local Comparisons 82

Tags: 大模型 推理 认知科学 研究进展
Source: arXiv Artificial Intelligence | 阅读原文

[摘要]
研究发现Transformer仅通过局部比较训练即可涌现一维序数几何结构，其排序主轴精确恢复隐藏全序，并复现人类符号距离效应，为跨物种传递推理提供了神经几何解释。

RobotValues: Evaluating Household Robots When Human Values Conflict 82

Tags: 智能体 AI安全 模型发布 多模态
Source: arXiv Artificial Intelligence | 阅读原文

[摘要]
新基准RobotValues评估家用机器人在价值冲突场景中的行为，发现VLM模型默认偏好安全与包容，但难以按指令调整价值观，80%场景选错动作，对机器人价值对齐研究有重要意义。

Code-on-Graph: Iterative Programmatic Reasoning via Large Language Models on Knowledge Graphs 82

Tags: LLM 知识图谱 推理 研究进展
Source: arXiv Artificial Intelligence | 阅读原文

[摘要]
提出Code-on-Graph框架，通过代码生成与知识图谱模式实现灵活编程推理，避免直接注入大规模事实，在三个KG问答基准上超越前SOTA达10.5%。

Entropy Is Not Enough: Unlocking Effective Reinforcement Learning for Visual Reasoning via Vision-Anchored Token Selection 82

Tags: 多模态 强化学习 推理优化 训练方法
Source: arXiv Artificial Intelligence | 阅读原文

[摘要]
VEPO提出视觉锚定 token 选择机制，解决视觉推理中熵无效问题，显著提升多模态 RL 性能（7B 模型提升 2.28 点）。

Towards a Science of AI Agent Reliability 82

Tags: AI安全 智能体 模型评估
Source: arXiv Machine Learning | 阅读原文

[摘要]
提出12个指标系统衡量AI Agent可靠性（一致性、鲁棒性、可预测性、安全性），评估15个模型发现能力提升对可靠性改善很小，为安全部署提供新评估框架。

Qwen-Image-Flash: Beyond Objective Design 82

Tags: 图像生成 模型蒸馏 训练策略 推理加速
Source: arXiv Machine Learning | 阅读原文

[摘要]
提出基于训练配方优化的少步蒸馏方法，通过调整数据构成、教师引导与任务混合加速视觉生成模型，发布Qwen-Image-Flash。

P\textsuperscript{2}-DPO: Grounding Hallucination in Perceptual Processing via Calibration Direct Preference Optimization 82

Tags: 多模态大模型 训练方法 幻觉缓解 DPO优化
Source: arXiv Machine Learning | 阅读原文

[摘要]
提出P²-DPO训练范式，通过自生成偏好对与校准损失优化多模态大模型感知瓶颈与视觉鲁棒性，有效缓解幻觉且降低人工反馈成本。

Patcher: Post-Hoc Patching of Backdoored Large Language Models 82

Tags: 大模型安全 后门防御 对抗鲁棒性
Source: arXiv Machine Learning | 阅读原文

[摘要]
提出Patcher框架，仅凭单条失败案例即可定位并修复大语言模型的后门攻击，在保持模型性能的同时有效抵御自适应攻击。

2026-06-05 ​

Nex-N2-Pro 发布：基于 Qwen3.5 的 397B MoE 推理模型，性能达 GPT-5.5 水平 95 ​

微软与OpenAI分道扬镳--如今双方准备正面交锋 90 ​

OpenAI称AI递归自我改进迹象初现 85 ​

Meet OpenJarvis：一个本地优先的设备端个人AI智能体框架，支持工具、记忆与学习 85 ​

黄仁勋与纳德拉共议智能体AI时代 85 ​

NVIDIA Research 在 CVPR 2026 发表三篇论文：规模化训练实现抓取、自动驾驶与智能体泛化 85 ​

In-Context Graphical Inference 85 ​

Adaptive Information Control for Search-Augmented LLM Reasoning 85 ​

Martingale Neural Operators: Learning Stochastic Marginals via Doob-Meyer Factorization 83 ​

Boson AI 与 LMSYS 发布基于 SGLang-Omni 的 Higgs Audio v3 TTS 端到端服务 82 ​

Depth-Attention: Cross-Layer Value Mixing for Language Models 82 ​

Hint Tuning: Less Data Makes Better Reasoners 82 ​

Emergent Ordinal Geometry in Transformers Trained on Local Comparisons 82 ​

RobotValues: Evaluating Household Robots When Human Values Conflict 82 ​

Code-on-Graph: Iterative Programmatic Reasoning via Large Language Models on Knowledge Graphs 82 ​

Entropy Is Not Enough: Unlocking Effective Reinforcement Learning for Visual Reasoning via Vision-Anchored Token Selection 82 ​

Towards a Science of AI Agent Reliability 82 ​

Qwen-Image-Flash: Beyond Objective Design 82 ​

P\textsuperscript{2}-DPO: Grounding Hallucination in Perceptual Processing via Calibration Direct Preference Optimization 82 ​

Patcher: Post-Hoc Patching of Backdoored Large Language Models 82 ​

2026-06-05

Nex-N2-Pro 发布：基于 Qwen3.5 的 397B MoE 推理模型，性能达 GPT-5.5 水平 95

微软与OpenAI分道扬镳--如今双方准备正面交锋 90

OpenAI称AI递归自我改进迹象初现 85

Meet OpenJarvis：一个本地优先的设备端个人AI智能体框架，支持工具、记忆与学习 85

黄仁勋与纳德拉共议智能体AI时代 85

NVIDIA Research 在 CVPR 2026 发表三篇论文：规模化训练实现抓取、自动驾驶与智能体泛化 85

In-Context Graphical Inference 85

Adaptive Information Control for Search-Augmented LLM Reasoning 85

Martingale Neural Operators: Learning Stochastic Marginals via Doob-Meyer Factorization 83

Boson AI 与 LMSYS 发布基于 SGLang-Omni 的 Higgs Audio v3 TTS 端到端服务 82

Depth-Attention: Cross-Layer Value Mixing for Language Models 82

Hint Tuning: Less Data Makes Better Reasoners 82

Emergent Ordinal Geometry in Transformers Trained on Local Comparisons 82

RobotValues: Evaluating Household Robots When Human Values Conflict 82

Code-on-Graph: Iterative Programmatic Reasoning via Large Language Models on Knowledge Graphs 82

Entropy Is Not Enough: Unlocking Effective Reinforcement Learning for Visual Reasoning via Vision-Anchored Token Selection 82

Towards a Science of AI Agent Reliability 82

Qwen-Image-Flash: Beyond Objective Design 82

P\textsuperscript{2}-DPO: Grounding Hallucination in Perceptual Processing via Calibration Direct Preference Optimization 82

Patcher: Post-Hoc Patching of Backdoored Large Language Models 82