AI & ML 2026-3-21
TorchSpec实现大规模推测解码训练,PyTorch 2.10+TorchAO赋能Intel AIPC场景,领域嵌入模型构建效率突破,Mellea 0.4.0与Granite库发布新功能,美团BI在指标平台实践持续深化。
TorchSpec: Speculative Decoding Training at Scale 92
Tags:
推测解码大模型训练分布式系统RDMA隐状态传输Source:
Pytorch_Blog| 阅读原文
[摘要]
提出TorchSpec框架,通过RDMA直连的Mooncake存储实现隐状态流式传输,解决大模型推测解码训练中的隐状态存储与通信瓶颈。
Build a Domain-Specific Embedding Model in Under a Day 88
Tags:
领域嵌入合成数据生成无监督微调对比学习信息检索Source:
HuggingFace| 阅读原文
[摘要]
基于合成数据与无监督硬负样本挖掘,仅用单张GPU在一天内实现领域嵌入模型的高效微调,显著提升信息检索性能,无需人工标注。
PyTorch 2.10+TorchAO: Powering AIPC scenarios on Intel® Core™ Ultra Series 3 processors 85
Tags:
IntelXe3XMXPyTorchTorchAOLLM inferenceedge AIquantizationSource:
Pytorch_Blog| 阅读原文
[摘要]
Intel Core Ultra Series 3处理器与PyTorch 2.10协同优化,通过Xe3架构、96个XMX引擎及TorchAO量化技术,实现PC与边缘端大模型高效推理。
What's New in Mellea 0.4.0 + Granite Libraries Release 85
Tags:
大模型生成式AI工作流架构约束解码LoRARAG安全对齐Source:
HuggingFace| 阅读原文
[摘要]
Mellea 0.4.0与Granite Libraries发布,通过约束解码与专用LoRA适配器实现可验证、安全的结构化生成工作流,提升大模型应用的可维护性与可靠性。
美团 BI 在指标平台和分析引擎上的探索和实践 85
Tags:
指标平台自动语义增强计算数据治理BI架构大数据查询优化Source:
Meituan_Tech| 阅读原文
[摘要]
美团构建以指标平台为核心的新一代BI架构,通过自动语义与增强计算能力,实现指标定义即研发、跨模型智能路由与高性能查询,解决数据口径混乱与查询性能瓶颈问题。