AI & ML 2026-2-3
多模态与推理能力持续突破,LongCat-Flash-Thinking-2601展现强泛化潜力;Llama 3.1微调实现高效推理优化;美团2025技术年货重磅发布,智启未来。
多维创新打造强泛化智能体模型,LongCat-Flash-Thinking-2601技术报告发布 94
Tags:
MoE强化学习智能体多环境训练抗噪训练通用人工智能Source:
Meituan_Tech| 阅读原文
[摘要]
LongCat-Flash-Thinking-2601通过环境扩展、多环境强化学习与抗噪训练,构建具备强泛化能力的通用智能体模型,实现复杂真实任务中稳定执行。
Unlock Reasoning in Llama 3.1-8B via Full Fine-Tuning on NVIDIA DGX Spark 85
Tags:
本地大模型全量微调合成数据生成推理增强DGX SparkSource:
Pytorch_Blog| 阅读原文
[摘要]
通过在本地DGX Spark上对Llama 3.1-8B-Instruct进行全量微调,利用合成思维链数据实现推理能力增强,验证了小规模本地训练的可行性与高效性。
2025美团技术年货,「马」上到来 78
Tags:
大模型开源AI Coding技术博客多模态产学研合作Source:
Meituan_Tech| 阅读原文
[摘要]
美团技术团队汇编过去一年40余篇优质技术文章,涵盖大模型、开源项目、AI Coding与多领域实践,形成500页电子书以共享前沿技术成果。