AI & ML 2026-1-28
本期聚焦阿拉伯语大模型对阿联酋方言的评估挑战,中国开源AI生态的架构演进,以及GPT-OSS智能体强化学习训练的实践反思,揭示多语言、本土化与可扩展性在AI发展中的关键作用。
Alyah ⭐️: Toward Robust Evaluation of Emirati Dialect Capabilities in Arabic LLMs 87
Tags:
阿拉伯语NLP方言评估大模型评测文化语义Emirati dialectSource:
HuggingFace| 阅读原文
[摘要]
提出首个聚焦阿联酋方言的阿拉伯语大模型评估基准Alyah,系统评测LLMs在文化语境、方言语法与习语理解上的真实能力。
Architectural Choices in China's Open-Source AI Ecosystem: Building Beyond DeepSeek 85
Tags:
Mixture of Experts多模态小模型国产硬件开源生态Source:
HuggingFace| 阅读原文
[摘要]
中国开源AI生态在2025年转向以MoE架构为主导,推动多模态与小模型发展,结合国产硬件适配,实现高性能与低成本的可持续部署。
Unlocking Agentic RL Training for GPT-OSS: A Practical Retrospective 85
Tags:
Agentic RLGPT-OSSReinforcement LearningMulti-step Decision MakingSource:
HuggingFace| 阅读原文
[摘要]
首次验证GPT-OSS模型在多步决策场景中支持代理强化学习(Agentic RL)训练的可行性,通过交互式闭环优化实现端到端策略学习。