2026-06-02
研究LLM对齐后产生的AI风格特征,提出PASTA方法通过激活消除降低AI检测率,揭示风格特征可定位与因果干预。 提出ImmersiveTTS模型,基于多模态扩散Transformer实现环境感知语音合成,通过跨模态交互与领域表示对齐提升自然度和保真度。 新基准LongDS测试长程多轮数据分析能力,最佳模型准确率不足50%,揭示长程状态维护是关键瓶颈。
Measuring, Localizing, and Ablating Alignment Signatures in LLMs 85
Tags:
对齐AI安全可解释性大模型Source:
arXiv Computation and Language| 阅读原文
[摘要]
研究LLM对齐后产生的AI风格特征,提出PASTA方法通过激活消除降低AI检测率,揭示风格特征可定位与因果干预。
ImmersiveTTS: Environment-Aware Text-to-Speech with Multimodal Diffusion Transformer and Domain-Specific Representation Alignment 85
Tags:
语音合成多模态扩散模型TTSSource:
arXiv Computation and Language| 阅读原文
[摘要]
提出ImmersiveTTS模型,基于多模态扩散Transformer实现环境感知语音合成,通过跨模态交互与领域表示对齐提升自然度和保真度。
LongDS-Bench: On the Failure of Long-Horizon Agentic Data Analysis 85
Tags:
评测基准AI代理数据分析Source:
arXiv Computation and Language| 阅读原文
[摘要]
新基准LongDS测试长程多轮数据分析能力,最佳模型准确率不足50%,揭示长程状态维护是关键瓶颈。
Counterfactual Evaluation Reveals Hidden Capability Profiles in Clinical LLMs and Agents 85
Tags:
医学AI模型评估AI安全Source:
arXiv Computation and Language| 阅读原文
[摘要]
提出因果敏感度分数CSS,用反事实干预评估临床大模型和智能体的响应能力,发现覆盖指标(如CMS)无法揭示的安全盲点和模型排名反转。
Self-Reflective Generation at Test Time 85
Tags:
大模型推理优化自反思Source:
arXiv Computation and Language| 阅读原文
[摘要]
SRGen提出轻量级测试时框架,通过动态熵阈值识别高不确定性token,训练修正向量实现自反思生成,显著提升大型语言模型的数学推理能力。
SERA: Soft-Verified Efficient Repository Agents 85
Tags:
编码代理训练方法合成数据开源模型Source:
arXiv Computation and Language| 阅读原文
[摘要]
SERA通过软验证生成合成轨迹,大幅降低训练私有代码库专用编码代理的成本(比RL低26倍),性能匹配开源模型,并开源所有代码和数据。
EvoDefense: Co-Evolving Black-Box Defense with Large Language Models 85
Tags:
AI安全大模型对抗防御进化优化Source:
arXiv Computation and Language| 阅读原文
[摘要]
EvoDefense 提出一种经验引导的共进化黑盒防御范式,利用守卫LLM与攻击生成器持续对抗进化,无需重训练即可泛化防御多种未见攻击与模型,显著降低攻击成功率。
Esoteric Language Models: A Family of Any-Order Diffusion LLMs 85
Tags:
扩散模型语言模型推理优化模型架构Source:
arXiv Computation and Language| 阅读原文
[摘要]
Eso-LMs融合自回归与掩码扩散模型,采用因果注意力实现首次MDM的KV缓存和并行生成,建立无条件生成速度-质量新标杆。
LongTraceRL: Learning Long-Context Reasoning from Search Agent Trajectories with Rubric Rewards 85
Tags:
大模型推理优化长上下文强化学习Source:
arXiv Computation and Language| 阅读原文
[摘要]
提出LongTraceRL方法,通过搜索智能体轨迹构建高混淆度干扰项,并设计基于实体的细粒度过程奖励,有效提升大模型长上下文推理能力,在多个基准上超越基线方法。
ParisKV: Fast and Drift-Robust KV-Cache Retrieval for Long-Context LLMs 85
Tags:
大模型推理优化KV缓存长上下文Source:
arXiv Computation and Language| 阅读原文
[摘要]
ParisKV是一个面向长上下文LLM的漂移鲁棒、GPU原生KV缓存检索框架,采用碰撞选择与量化重排序,在百万token长度下解码延迟比MagicPIG和PQCache降低17倍和44倍,吞吐量提升至2.8倍。
Learning Whom to Trust: Market-Feedback Adaptive Retrieval for Frozen LLMs in Event-Driven Financial RAG 85
Tags:
金融RAG检索优化自适应学习大模型Source:
arXiv Computation and Language| 阅读原文
[摘要]
提出一种基于贝叶斯源记忆的市场反馈自适应检索方法,在金融事件驱动RAG中通过调整检索源而非微调LLM,显著提升预测F1和投资组合夏普比率。
The Information Geometry of Softmax: Probing and Steering 85
Tags:
表示学习模型可解释性AI安全Source:
arXiv Computation and Language| 阅读原文
[摘要]
该论文从信息几何角度分析softmax表示,提出“双引导”方法,可稳健操控模型概念表示,并保持无关概念不变,提升可控性与稳定性。
Skill is Not One-Size-Fits-All: Model-Aware Skill Alignment for LLM Agents 85
Tags:
大模型智能体技能对齐Source:
arXiv Computation and Language| 阅读原文
[摘要]
提出模型感知的技能对齐框架MASA,通过分层演化和轻量重写器为不同LLM骨干适配技能,在多个交互任务上提升高达25.8分。
Beyond Static Dialogues: Benchmarking Realistic, Heterogeneous, and Evolving Long-Term Memory 85
Tags:
大模型评测基准记忆机制Source:
arXiv Computation and Language| 阅读原文
[摘要]
提出RHELM基准,模拟真实、异质、动态演化的长期记忆对话场景,评估LLM在多源聚合与上下文推理上的表现,揭示当前模型在复杂环境下的关键弱点。
Learning to Reason with Insight for Informal Theorem Proving 85
Tags:
大模型推理优化数学推理Source:
arXiv Computation and Language| 阅读原文
[摘要]
提出DeepInsight框架,通过层级数据集、渐进式多阶段SFT和InsightPO策略,提升大语言模型在非正式定理证明中的洞察推理能力,数学基准上显著优于基线。
Unraveling LoRA Interference: Orthogonal Subspaces for Robust Model Merging 85
Tags:
LoRA模型合并多任务学习微调Source:
arXiv Computation and Language| 阅读原文
[摘要]
研究LoRA微调模型合并的干扰问题,提出正交子空间方法,在不牺牲单任务性能下提升多任务合并效果,兼容现有算法。
Variational Routing: A Scalable Bayesian Framework for Calibrated Mixture-of-Experts Transformers 85
Tags:
混合专家模型贝叶斯推断不确定性量化推理优化Source:
arXiv Artificial Intelligence| 阅读原文
[摘要]
提出变分混合专家路由(VMoER),在MoE层引入贝叶斯不确定性估计,显著降低校准误差94%,提高鲁棒性,额外计算开销极低。
CVE-Factory: Scaling Expert-Level Agentic Tasks for Code Security Vulnerability 85
Tags:
代码安全智能体模型微调基准测试Source:
arXiv Artificial Intelligence| 阅读原文
[摘要]
CVE-Factory提出多智能体框架自动将CVE元数据转化为可执行安全任务,构建LiveCVEBench基准,微调Qwen3-32B显著提升安全能力并超越Claude 4.5 Sonnet。
HiPER: Hierarchical Reinforcement Learning with Explicit Credit Assignment for Large Language Model Agents 85
Tags:
大模型强化学习层次化规划多轮决策Source:
arXiv Artificial Intelligence| 阅读原文
[摘要]
HiPER提出层次化计划执行强化学习框架,通过层次优势估计实现显式信用分配,显著提升多轮LLM智能体在稀疏奖励长时任务中的性能
ASH: Agents that Self-Hone via Embodied Learning 85
Tags:
强化学习智能体模仿学习长期任务Source:
arXiv Artificial Intelligence| 阅读原文
[摘要]
提出ASH智能体系统,通过自改进循环从未标记互联网视频学习,无需人工奖励或标注,在长期游戏任务中远超基线方法。