2026-06-09

OpenAI公布路线图，计划到2028年3月由AI主导大部分研究，目标包括构建自动AI研究员、加速科学产出并实现个人AGI，展现前沿AGI战略愿景。苹果发布第三代Apple Foundation Models基础模型家族，与Google合作定制，覆盖设备端到云端，驱动Apple Intelligence功能，以隐私为核心设计。 RASFT提出自适应的监督微…

OpenAI计划到2028年由AI主导研究 88

Tags: 公司动态 大模型 AI安全
Source: AI HOT 精选 | 阅读原文

[摘要]
OpenAI公布路线图，计划到2028年3月由AI主导大部分研究，目标包括构建自动AI研究员、加速科学产出并实现个人AGI，展现前沿AGI战略愿景。

苹果发布第三代 Apple Foundation Models（AFM） 85

Tags: 模型发布 大模型 公司动态 AI安全
Source: AI HOT 精选 | 阅读原文

[摘要]
苹果发布第三代Apple Foundation Models基础模型家族，与Google合作定制，覆盖设备端到云端，驱动Apple Intelligence功能，以隐私为核心设计。

RASFT: Rollout-Adaptive Supervised Fine-Tuning for Reasoning 85

Tags: 训练方法 推理优化 大模型
Source: arXiv Computation and Language | 阅读原文

[摘要]
RASFT提出自适应的监督微调框架，根据模型对问题的求解能力调整监督信号，在数学和代码推理任务上超越SFT与强化学习方法，是训练方法的重要改进。

OffQ: Taming Structured Outliers in LLM Quantization by Offsetting 85

Tags: 模型量化 推理优化 低比特量化 LLM
Source: arXiv Computation and Language | 阅读原文

[摘要]
OffQ提出偏移机制处理LLM量化中激活异常值，实现W4A4KV4高效量化，性能优于现有方法，有助于低比特推理加速。

MemDreamer: Decoupling Perception and Reasoning for Long Video Understanding via Hierarchical Graph Memory and Agentic Retrieval Mechanism 85

Tags: 多模态 智能体 视频理解 模型发布
Source: arXiv Computation and Language | 阅读原文

[摘要]
MemDreamer提出分层图记忆与智能体检索机制，解决长视频理解中token爆炸与注意力稀释问题，在主流基准上达到SOTA，推理上下文窗口仅2%，准确率提升12.5点。

The Piggyback Hypothesis of Generalization: Explaining and Mitigating Emergent Misalignment 85

Tags: 大模型 AI安全 微调对齐
Source: arXiv Computation and Language | 阅读原文

[摘要]
提出“搭便车假设”解释大模型微调后出现突现错位的原因，并设计TReFT正则化方法有效缓解该问题，为安全微调提供新视角。

Train Models Faster with JAX and MaxText Using NVFP4 on NVIDIA Blackwell 82

Tags: 训练加速 推理优化 芯片算力 开源框架
Source: NVIDIA Technical Blog - Generative AI | 阅读原文

[摘要]
NVIDIA推出在Blackwell架构上使用NVFP4（4位浮点）结合JAX/MaxText加速大模型预训练的方法，可大幅提升吞吐量，对算力与训练优化有重要影响。

VoxCPM2 技术报告发布 82

Tags: 模型发布 语音生成 开源生态 多模态
Source: AI HOT 精选 | 阅读原文

[摘要]
面壁智能发布VoxCPM2语音生成模型，2B参数，支持30种语言和9种中文方言，基于200万小时数据训练，实现SOTA性能，已开源。

Self-Consistency from Only Two Samples: CoT-PoT Ensembling for Efficient LLM Reasoning 82

Tags: 推理优化 模型发布 大模型
Source: arXiv Computation and Language | 阅读原文

[摘要]
提出 CoT-PoT 混合集成方法，仅需两个样本即可实现自一致性推理，计算成本降低 9.3 倍，大幅提升 LLM 推理效率。

AAAC: Activation-Aware Adaptive Codebooks for 4-bit LLM Weight Quantization 82

Tags: 模型压缩 推理优化 量化 LLM
Source: arXiv Computation and Language | 阅读原文

[摘要]
提出AAAC方法，通过激活感知自适应码本实现4位LLM权重量化，3-30分钟完成，零存储开销，多个模型上精度超越现有方法，显著提升推理效率。

Perplexity与哈佛：AI智能体提效87%降本94% 80

Tags: 智能体 研究发布 效率提升
Source: AI HOT 精选 | 阅读原文

[摘要]
Perplexity与哈佛大学联合研究显示，AI自主智能体相比传统搜索提升87%效率并降低94%成本，知识工作模式迎来重大变革。

Runway Aleph 2.0 编辑模型：一键适配任意视频格式 80

Tags: 模型发布 视频生成 产品更新
Source: AI HOT 精选 | 阅读原文

[摘要]
Runway发布Aleph 2.0编辑模型，可将视频一键适配任意宽高比并智能填充场景，提升视频格式兼容性与创作效率。

NotebookLM重大升级：智能体能力与高级推理 80

Tags: 产品发布 智能体 AI应用
Source: AI HOT 精选 | 阅读原文

[摘要]
Google NotebookLM重大升级，新增智能体能力和高级推理，针对复杂多步骤研究问题，仅对AI Ultra订阅者开放。

为生物学AI智能体铺路 80

Tags: 智能体 AI for Science 数据基础设施
Source: AI HOT 精选 | 阅读原文

[摘要]
实验发现Claude、Biomni等科研智能体从病毒学数据库检索序列准确率低，加入确定性检索层gget virus后接近100%，揭示生物学数据碎片化问题，为AI智能体可靠应用奠定基础。

微信AI Agent生态曝光：嵌入小程序调用与手机厂商合作 80

Tags: 智能体 产品发布 公司动态
Source: AI HOT 精选 | 阅读原文

[摘要]
腾讯微信正测试AI Agent，可调用小程序完成任务并与多家手机厂商合作，推动Agentic Commerce生态发展。

小米 MiMo-V2.5-Pro-UltraSpeed 突破 1，000 tokens/s，单台 8-GPGPU 节点运行 1T MoE 模型 80

Tags: 推理优化 模型发布 公司动态 芯片算力
Source: AI HOT 精选 | 阅读原文

[摘要]
小米推出MiMo-V2.5-Pro-UltraSpeed，首次在单台8-GPGPU节点上实现1万亿参数MoE模型超1000 tokens/s推理速度，大幅提升产出效率并开放限时免费体验。

开源社区支持 OpenEnv 用于智能体强化学习 80

Tags: 智能体 强化学习 开源生态 基础设施
Source: AI HOT 精选 | 阅读原文

[摘要]
Hugging Face宣布OpenEnv项目进一步开放，获PyTorch Foundation、vLLM等支持，标准化智能体执行环境，推动开源智能体强化学习基础建设。

AgentScope Java 2.0 发布 80

Tags: 开源生态 智能体 产品发布
Source: AI HOT 精选 | 阅读原文

[摘要]
阿里云发布AgentScope Java 2.0，企业级AI智能体框架，支持分布式架构、多租户隔离与安全执行，提升生产环境可用性。

微软AI CEO：超级智能即将到来，但不会取代你的工作 80

Tags: 公司动态 大模型 模型发布
Source: AI HOT 精选 | 阅读原文

[摘要]
微软AI CEO称超级智能即将到来但不会取代工作，透露与OpenAI新合同并获准独立研究，Build大会发布7个全模态新模型。

NVIDIA与LG集团合作建设AI工厂，加速物理AI与自动驾驶 80

Tags: 公司动态 物理AI 自动驾驶 机器人
Source: AI HOT 精选 | 阅读原文

[摘要]
NVIDIA与LG集团合作建设AI工厂，整合Isaac Sim、DRIVE等平台，加速机器人仿真、自动驾驶与AI基础设施落地。

2026-06-09 ​

OpenAI计划到2028年由AI主导研究 88 ​

苹果发布第三代 Apple Foundation Models（AFM） 85 ​

RASFT: Rollout-Adaptive Supervised Fine-Tuning for Reasoning 85 ​

OffQ: Taming Structured Outliers in LLM Quantization by Offsetting 85 ​

MemDreamer: Decoupling Perception and Reasoning for Long Video Understanding via Hierarchical Graph Memory and Agentic Retrieval Mechanism 85 ​

The Piggyback Hypothesis of Generalization: Explaining and Mitigating Emergent Misalignment 85 ​

Train Models Faster with JAX and MaxText Using NVFP4 on NVIDIA Blackwell 82 ​

VoxCPM2 技术报告发布 82 ​

Self-Consistency from Only Two Samples: CoT-PoT Ensembling for Efficient LLM Reasoning 82 ​

AAAC: Activation-Aware Adaptive Codebooks for 4-bit LLM Weight Quantization 82 ​

Perplexity与哈佛：AI智能体提效87%降本94% 80 ​

Runway Aleph 2.0 编辑模型：一键适配任意视频格式 80 ​

NotebookLM重大升级：智能体能力与高级推理 80 ​

为生物学AI智能体铺路 80 ​

微信AI Agent生态曝光：嵌入小程序调用与手机厂商合作 80 ​

小米 MiMo-V2.5-Pro-UltraSpeed 突破 1，000 tokens/s，单台 8-GPGPU 节点运行 1T MoE 模型 80 ​

开源社区支持 OpenEnv 用于智能体强化学习 80 ​

AgentScope Java 2.0 发布 80 ​

微软AI CEO：超级智能即将到来，但不会取代你的工作 80 ​

NVIDIA与LG集团合作建设AI工厂，加速物理AI与自动驾驶 80 ​

2026-06-09

OpenAI计划到2028年由AI主导研究 88

苹果发布第三代 Apple Foundation Models（AFM） 85

RASFT: Rollout-Adaptive Supervised Fine-Tuning for Reasoning 85

OffQ: Taming Structured Outliers in LLM Quantization by Offsetting 85

MemDreamer: Decoupling Perception and Reasoning for Long Video Understanding via Hierarchical Graph Memory and Agentic Retrieval Mechanism 85

The Piggyback Hypothesis of Generalization: Explaining and Mitigating Emergent Misalignment 85

Train Models Faster with JAX and MaxText Using NVFP4 on NVIDIA Blackwell 82

VoxCPM2 技术报告发布 82

Self-Consistency from Only Two Samples: CoT-PoT Ensembling for Efficient LLM Reasoning 82

AAAC: Activation-Aware Adaptive Codebooks for 4-bit LLM Weight Quantization 82

Perplexity与哈佛：AI智能体提效87%降本94% 80

Runway Aleph 2.0 编辑模型：一键适配任意视频格式 80

NotebookLM重大升级：智能体能力与高级推理 80

为生物学AI智能体铺路 80

微信AI Agent生态曝光：嵌入小程序调用与手机厂商合作 80

小米 MiMo-V2.5-Pro-UltraSpeed 突破 1，000 tokens/s，单台 8-GPGPU 节点运行 1T MoE 模型 80

开源社区支持 OpenEnv 用于智能体强化学习 80

AgentScope Java 2.0 发布 80

微软AI CEO：超级智能即将到来，但不会取代你的工作 80

NVIDIA与LG集团合作建设AI工厂，加速物理AI与自动驾驶 80