Skip to content

2026-06-09

OpenAI公布路线图,计划到2028年3月由AI主导大部分研究,目标包括构建自动AI研究员、加速科学产出并实现个人AGI,展现前沿AGI战略愿景。 苹果发布第三代Apple Foundation Models基础模型家族,与Google合作定制,覆盖设备端到云端,驱动Apple Intelligence功能,以隐私为核心设计。 RASFT提出自适应的监督微…

OpenAI计划到2028年由AI主导研究 88

  • Tags: 公司动态 大模型 AI安全

  • Source: AI HOT 精选 | 阅读原文

[摘要]
OpenAI公布路线图,计划到2028年3月由AI主导大部分研究,目标包括构建自动AI研究员、加速科学产出并实现个人AGI,展现前沿AGI战略愿景。


苹果发布第三代 Apple Foundation Models(AFM) 85

  • Tags: 模型发布 大模型 公司动态 AI安全

  • Source: AI HOT 精选 | 阅读原文

[摘要]
苹果发布第三代Apple Foundation Models基础模型家族,与Google合作定制,覆盖设备端到云端,驱动Apple Intelligence功能,以隐私为核心设计。


RASFT: Rollout-Adaptive Supervised Fine-Tuning for Reasoning 85

  • Tags: 训练方法 推理优化 大模型

  • Source: arXiv Computation and Language | 阅读原文

[摘要]
RASFT提出自适应的监督微调框架,根据模型对问题的求解能力调整监督信号,在数学和代码推理任务上超越SFT与强化学习方法,是训练方法的重要改进。


OffQ: Taming Structured Outliers in LLM Quantization by Offsetting 85

  • Tags: 模型量化 推理优化 低比特量化 LLM

  • Source: arXiv Computation and Language | 阅读原文

[摘要]
OffQ提出偏移机制处理LLM量化中激活异常值,实现W4A4KV4高效量化,性能优于现有方法,有助于低比特推理加速。


MemDreamer: Decoupling Perception and Reasoning for Long Video Understanding via Hierarchical Graph Memory and Agentic Retrieval Mechanism 85

  • Tags: 多模态 智能体 视频理解 模型发布

  • Source: arXiv Computation and Language | 阅读原文

[摘要]
MemDreamer提出分层图记忆与智能体检索机制,解决长视频理解中token爆炸与注意力稀释问题,在主流基准上达到SOTA,推理上下文窗口仅2%,准确率提升12.5点。


The Piggyback Hypothesis of Generalization: Explaining and Mitigating Emergent Misalignment 85

  • Tags: 大模型 AI安全 微调对齐

  • Source: arXiv Computation and Language | 阅读原文

[摘要]
提出“搭便车假设”解释大模型微调后出现突现错位的原因,并设计TReFT正则化方法有效缓解该问题,为安全微调提供新视角。


Train Models Faster with JAX and MaxText Using NVFP4 on NVIDIA Blackwell 82

  • Tags: 训练加速 推理优化 芯片算力 开源框架

  • Source: NVIDIA Technical Blog - Generative AI | 阅读原文

[摘要]
NVIDIA推出在Blackwell架构上使用NVFP4(4位浮点)结合JAX/MaxText加速大模型预训练的方法,可大幅提升吞吐量,对算力与训练优化有重要影响。


VoxCPM2 技术报告发布 82

  • Tags: 模型发布 语音生成 开源生态 多模态

  • Source: AI HOT 精选 | 阅读原文

[摘要]
面壁智能发布VoxCPM2语音生成模型,2B参数,支持30种语言和9种中文方言,基于200万小时数据训练,实现SOTA性能,已开源。


Self-Consistency from Only Two Samples: CoT-PoT Ensembling for Efficient LLM Reasoning 82

  • Tags: 推理优化 模型发布 大模型

  • Source: arXiv Computation and Language | 阅读原文

[摘要]
提出 CoT-PoT 混合集成方法,仅需两个样本即可实现自一致性推理,计算成本降低 9.3 倍,大幅提升 LLM 推理效率。


AAAC: Activation-Aware Adaptive Codebooks for 4-bit LLM Weight Quantization 82

  • Tags: 模型压缩 推理优化 量化 LLM

  • Source: arXiv Computation and Language | 阅读原文

[摘要]
提出AAAC方法,通过激活感知自适应码本实现4位LLM权重量化,3-30分钟完成,零存储开销,多个模型上精度超越现有方法,显著提升推理效率。


Perplexity与哈佛:AI智能体提效87%降本94% 80

  • Tags: 智能体 研究发布 效率提升

  • Source: AI HOT 精选 | 阅读原文

[摘要]
Perplexity与哈佛大学联合研究显示,AI自主智能体相比传统搜索提升87%效率并降低94%成本,知识工作模式迎来重大变革。


Runway Aleph 2.0 编辑模型:一键适配任意视频格式 80

  • Tags: 模型发布 视频生成 产品更新

  • Source: AI HOT 精选 | 阅读原文

[摘要]
Runway发布Aleph 2.0编辑模型,可将视频一键适配任意宽高比并智能填充场景,提升视频格式兼容性与创作效率。


NotebookLM重大升级:智能体能力与高级推理 80

  • Tags: 产品发布 智能体 AI应用

  • Source: AI HOT 精选 | 阅读原文

[摘要]
Google NotebookLM重大升级,新增智能体能力和高级推理,针对复杂多步骤研究问题,仅对AI Ultra订阅者开放。


为生物学AI智能体铺路 80

  • Tags: 智能体 AI for Science 数据基础设施

  • Source: AI HOT 精选 | 阅读原文

[摘要]
实验发现Claude、Biomni等科研智能体从病毒学数据库检索序列准确率低,加入确定性检索层gget virus后接近100%,揭示生物学数据碎片化问题,为AI智能体可靠应用奠定基础。


微信AI Agent生态曝光:嵌入小程序调用与手机厂商合作 80

  • Tags: 智能体 产品发布 公司动态

  • Source: AI HOT 精选 | 阅读原文

[摘要]
腾讯微信正测试AI Agent,可调用小程序完成任务并与多家手机厂商合作,推动Agentic Commerce生态发展。


小米 MiMo-V2.5-Pro-UltraSpeed 突破 1,000 tokens/s,单台 8-GPGPU 节点运行 1T MoE 模型 80

  • Tags: 推理优化 模型发布 公司动态 芯片算力

  • Source: AI HOT 精选 | 阅读原文

[摘要]
小米推出MiMo-V2.5-Pro-UltraSpeed,首次在单台8-GPGPU节点上实现1万亿参数MoE模型超1000 tokens/s推理速度,大幅提升产出效率并开放限时免费体验。


开源社区支持 OpenEnv 用于智能体强化学习 80

  • Tags: 智能体 强化学习 开源生态 基础设施

  • Source: AI HOT 精选 | 阅读原文

[摘要]
Hugging Face宣布OpenEnv项目进一步开放,获PyTorch Foundation、vLLM等支持,标准化智能体执行环境,推动开源智能体强化学习基础建设。


AgentScope Java 2.0 发布 80

  • Tags: 开源生态 智能体 产品发布

  • Source: AI HOT 精选 | 阅读原文

[摘要]
阿里云发布AgentScope Java 2.0,企业级AI智能体框架,支持分布式架构、多租户隔离与安全执行,提升生产环境可用性。


微软AI CEO:超级智能即将到来,但不会取代你的工作 80

  • Tags: 公司动态 大模型 模型发布

  • Source: AI HOT 精选 | 阅读原文

[摘要]
微软AI CEO称超级智能即将到来但不会取代工作,透露与OpenAI新合同并获准独立研究,Build大会发布7个全模态新模型。


NVIDIA与LG集团合作建设AI工厂,加速物理AI与自动驾驶 80

  • Tags: 公司动态 物理AI 自动驾驶 机器人

  • Source: AI HOT 精选 | 阅读原文

[摘要]
NVIDIA与LG集团合作建设AI工厂,整合Isaac Sim、DRIVE等平台,加速机器人仿真、自动驾驶与AI基础设施落地。