Skip to content

AI & ML 2026-3-21

TorchSpec实现大规模推测解码训练,PyTorch 2.10+TorchAO赋能Intel AIPC场景,领域嵌入模型构建效率突破,Mellea 0.4.0与Granite库发布新功能,美团BI在指标平台实践持续深化。

TorchSpec: Speculative Decoding Training at Scale 92

  • Tags: 推测解码 大模型训练 分布式系统 RDMA 隐状态传输

  • Source: Pytorch_Blog | 阅读原文

[摘要]
提出TorchSpec框架,通过RDMA直连的Mooncake存储实现隐状态流式传输,解决大模型推测解码训练中的隐状态存储与通信瓶颈。


Build a Domain-Specific Embedding Model in Under a Day 88

  • Tags: 领域嵌入 合成数据生成 无监督微调 对比学习 信息检索

  • Source: HuggingFace | 阅读原文

[摘要]
基于合成数据与无监督硬负样本挖掘,仅用单张GPU在一天内实现领域嵌入模型的高效微调,显著提升信息检索性能,无需人工标注。


PyTorch 2.10+TorchAO: Powering AIPC scenarios on Intel® Core™ Ultra Series 3 processors 85

  • Tags: Intel Xe3 XMX PyTorch TorchAO LLM inference edge AI quantization

  • Source: Pytorch_Blog | 阅读原文

[摘要]
Intel Core Ultra Series 3处理器与PyTorch 2.10协同优化,通过Xe3架构、96个XMX引擎及TorchAO量化技术,实现PC与边缘端大模型高效推理。


What's New in Mellea 0.4.0 + Granite Libraries Release 85

  • Tags: 大模型 生成式AI 工作流架构 约束解码 LoRA RAG 安全对齐

  • Source: HuggingFace | 阅读原文

[摘要]
Mellea 0.4.0与Granite Libraries发布,通过约束解码与专用LoRA适配器实现可验证、安全的结构化生成工作流,提升大模型应用的可维护性与可靠性。


美团 BI 在指标平台和分析引擎上的探索和实践 85

  • Tags: 指标平台 自动语义 增强计算 数据治理 BI架构 大数据查询优化

  • Source: Meituan_Tech | 阅读原文

[摘要]
美团构建以指标平台为核心的新一代BI架构,通过自动语义与增强计算能力,实现指标定义即研发、跨模型智能路由与高性能查询,解决数据口径混乱与查询性能瓶颈问题。