Skip to content

AI & ML 2026-1-28

本期聚焦阿拉伯语大模型对阿联酋方言的评估挑战,中国开源AI生态的架构演进,以及GPT-OSS智能体强化学习训练的实践反思,揭示多语言、本土化与可扩展性在AI发展中的关键作用。

Alyah ⭐️: Toward Robust Evaluation of Emirati Dialect Capabilities in Arabic LLMs 87

  • Tags: 阿拉伯语NLP 方言评估 大模型评测 文化语义 Emirati dialect

  • Source: HuggingFace | 阅读原文

[摘要]
提出首个聚焦阿联酋方言的阿拉伯语大模型评估基准Alyah,系统评测LLMs在文化语境、方言语法与习语理解上的真实能力。


Architectural Choices in China's Open-Source AI Ecosystem: Building Beyond DeepSeek 85

  • Tags: Mixture of Experts 多模态 小模型 国产硬件 开源生态

  • Source: HuggingFace | 阅读原文

[摘要]
中国开源AI生态在2025年转向以MoE架构为主导,推动多模态与小模型发展,结合国产硬件适配,实现高性能与低成本的可持续部署。


Unlocking Agentic RL Training for GPT-OSS: A Practical Retrospective 85

  • Tags: Agentic RL GPT-OSS Reinforcement Learning Multi-step Decision Making

  • Source: HuggingFace | 阅读原文

[摘要]
首次验证GPT-OSS模型在多步决策场景中支持代理强化学习(Agentic RL)训练的可行性,通过交互式闭环优化实现端到端策略学习。