2026-06-09
OpenAI公布路线图,计划到2028年3月由AI主导大部分研究,目标包括构建自动AI研究员、加速科学产出并实现个人AGI,展现前沿AGI战略愿景。 苹果发布第三代Apple Foundation Models基础模型家族,与Google合作定制,覆盖设备端到云端,驱动Apple Intelligence功能,以隐私为核心设计。 RASFT提出自适应的监督微…
OpenAI计划到2028年由AI主导研究 88
Tags:
公司动态大模型AI安全Source:
AI HOT 精选| 阅读原文
[摘要]
OpenAI公布路线图,计划到2028年3月由AI主导大部分研究,目标包括构建自动AI研究员、加速科学产出并实现个人AGI,展现前沿AGI战略愿景。
苹果发布第三代 Apple Foundation Models(AFM) 85
Tags:
模型发布大模型公司动态AI安全Source:
AI HOT 精选| 阅读原文
[摘要]
苹果发布第三代Apple Foundation Models基础模型家族,与Google合作定制,覆盖设备端到云端,驱动Apple Intelligence功能,以隐私为核心设计。
RASFT: Rollout-Adaptive Supervised Fine-Tuning for Reasoning 85
Tags:
训练方法推理优化大模型Source:
arXiv Computation and Language| 阅读原文
[摘要]
RASFT提出自适应的监督微调框架,根据模型对问题的求解能力调整监督信号,在数学和代码推理任务上超越SFT与强化学习方法,是训练方法的重要改进。
OffQ: Taming Structured Outliers in LLM Quantization by Offsetting 85
Tags:
模型量化推理优化低比特量化LLMSource:
arXiv Computation and Language| 阅读原文
[摘要]
OffQ提出偏移机制处理LLM量化中激活异常值,实现W4A4KV4高效量化,性能优于现有方法,有助于低比特推理加速。
MemDreamer: Decoupling Perception and Reasoning for Long Video Understanding via Hierarchical Graph Memory and Agentic Retrieval Mechanism 85
Tags:
多模态智能体视频理解模型发布Source:
arXiv Computation and Language| 阅读原文
[摘要]
MemDreamer提出分层图记忆与智能体检索机制,解决长视频理解中token爆炸与注意力稀释问题,在主流基准上达到SOTA,推理上下文窗口仅2%,准确率提升12.5点。
The Piggyback Hypothesis of Generalization: Explaining and Mitigating Emergent Misalignment 85
Tags:
大模型AI安全微调对齐Source:
arXiv Computation and Language| 阅读原文
[摘要]
提出“搭便车假设”解释大模型微调后出现突现错位的原因,并设计TReFT正则化方法有效缓解该问题,为安全微调提供新视角。
Train Models Faster with JAX and MaxText Using NVFP4 on NVIDIA Blackwell 82
Tags:
训练加速推理优化芯片算力开源框架Source:
NVIDIA Technical Blog - Generative AI| 阅读原文
[摘要]
NVIDIA推出在Blackwell架构上使用NVFP4(4位浮点)结合JAX/MaxText加速大模型预训练的方法,可大幅提升吞吐量,对算力与训练优化有重要影响。
VoxCPM2 技术报告发布 82
Tags:
模型发布语音生成开源生态多模态Source:
AI HOT 精选| 阅读原文
[摘要]
面壁智能发布VoxCPM2语音生成模型,2B参数,支持30种语言和9种中文方言,基于200万小时数据训练,实现SOTA性能,已开源。
Self-Consistency from Only Two Samples: CoT-PoT Ensembling for Efficient LLM Reasoning 82
Tags:
推理优化模型发布大模型Source:
arXiv Computation and Language| 阅读原文
[摘要]
提出 CoT-PoT 混合集成方法,仅需两个样本即可实现自一致性推理,计算成本降低 9.3 倍,大幅提升 LLM 推理效率。
AAAC: Activation-Aware Adaptive Codebooks for 4-bit LLM Weight Quantization 82
Tags:
模型压缩推理优化量化LLMSource:
arXiv Computation and Language| 阅读原文
[摘要]
提出AAAC方法,通过激活感知自适应码本实现4位LLM权重量化,3-30分钟完成,零存储开销,多个模型上精度超越现有方法,显著提升推理效率。
Perplexity与哈佛:AI智能体提效87%降本94% 80
Tags:
智能体研究发布效率提升Source:
AI HOT 精选| 阅读原文
[摘要]
Perplexity与哈佛大学联合研究显示,AI自主智能体相比传统搜索提升87%效率并降低94%成本,知识工作模式迎来重大变革。
Runway Aleph 2.0 编辑模型:一键适配任意视频格式 80
Tags:
模型发布视频生成产品更新Source:
AI HOT 精选| 阅读原文
[摘要]
Runway发布Aleph 2.0编辑模型,可将视频一键适配任意宽高比并智能填充场景,提升视频格式兼容性与创作效率。
NotebookLM重大升级:智能体能力与高级推理 80
Tags:
产品发布智能体AI应用Source:
AI HOT 精选| 阅读原文
[摘要]
Google NotebookLM重大升级,新增智能体能力和高级推理,针对复杂多步骤研究问题,仅对AI Ultra订阅者开放。
为生物学AI智能体铺路 80
Tags:
智能体AI for Science数据基础设施Source:
AI HOT 精选| 阅读原文
[摘要]
实验发现Claude、Biomni等科研智能体从病毒学数据库检索序列准确率低,加入确定性检索层gget virus后接近100%,揭示生物学数据碎片化问题,为AI智能体可靠应用奠定基础。
微信AI Agent生态曝光:嵌入小程序调用与手机厂商合作 80
Tags:
智能体产品发布公司动态Source:
AI HOT 精选| 阅读原文
[摘要]
腾讯微信正测试AI Agent,可调用小程序完成任务并与多家手机厂商合作,推动Agentic Commerce生态发展。
小米 MiMo-V2.5-Pro-UltraSpeed 突破 1,000 tokens/s,单台 8-GPGPU 节点运行 1T MoE 模型 80
Tags:
推理优化模型发布公司动态芯片算力Source:
AI HOT 精选| 阅读原文
[摘要]
小米推出MiMo-V2.5-Pro-UltraSpeed,首次在单台8-GPGPU节点上实现1万亿参数MoE模型超1000 tokens/s推理速度,大幅提升产出效率并开放限时免费体验。
开源社区支持 OpenEnv 用于智能体强化学习 80
Tags:
智能体强化学习开源生态基础设施Source:
AI HOT 精选| 阅读原文
[摘要]
Hugging Face宣布OpenEnv项目进一步开放,获PyTorch Foundation、vLLM等支持,标准化智能体执行环境,推动开源智能体强化学习基础建设。
AgentScope Java 2.0 发布 80
Tags:
开源生态智能体产品发布Source:
AI HOT 精选| 阅读原文
[摘要]
阿里云发布AgentScope Java 2.0,企业级AI智能体框架,支持分布式架构、多租户隔离与安全执行,提升生产环境可用性。
微软AI CEO:超级智能即将到来,但不会取代你的工作 80
Tags:
公司动态大模型模型发布Source:
AI HOT 精选| 阅读原文
[摘要]
微软AI CEO称超级智能即将到来但不会取代工作,透露与OpenAI新合同并获准独立研究,Build大会发布7个全模态新模型。
NVIDIA与LG集团合作建设AI工厂,加速物理AI与自动驾驶 80
Tags:
公司动态物理AI自动驾驶机器人Source:
AI HOT 精选| 阅读原文
[摘要]
NVIDIA与LG集团合作建设AI工厂,整合Isaac Sim、DRIVE等平台,加速机器人仿真、自动驾驶与AI基础设施落地。