Appearance
美团发布基于N-gram的全新模型,创新性引入嵌入扩展范式,实现轻量化MoE架构的高效进化,显著提升模型性能与推理效率,为大规模应用提供新路径。
Tags: MoE 嵌入扩展 稀疏激活 推理优化 大模型 N-gram嵌入
MoE
嵌入扩展
稀疏激活
推理优化
大模型
N-gram嵌入
Source: Meituan_Tech | 阅读原文
Meituan_Tech
[摘要] 提出嵌入扩展替代专家扩展的MoE新范式,通过N-gram嵌入与系统级优化实现高效稀疏推理,显著提升模型性能与推理效率。