2026-01-02 08:25:24

蚂蚁发布LLaDA2.0：百亿参数扩散模型实现性能突破

摘要

蚂蚁技术研究院正式发布LLaDA2 0系列离散扩散大语言模型，并同步公开相关技术报告。此次发布的模型标志着扩散架构在大模型领域的重大进展

蚂蚁发布LLaDA2.0：百亿参数扩散模型实现性能突破

蚂蚁技术研究院正式发布LLaDA2.0系列离散扩散大语言模型，并同步公开相关技术报告。此次发布的模型标志着扩散架构在大模型领域的重大进展，突破了此前业界对扩散模型难以实现大规模扩展的普遍认知，成功实现了参数规模与实际性能的双重跃升。

LLaDA2.0系列涵盖两个版本：基于MoE架构的16B（mini）与具备里程碑意义的100B（flash），首次将扩散模型的参数量级推进至百亿级别。实测结果显示，该模型在代码生成、数学推理及智能体任务等关键能力上，已超越同等规模的自回归模型，展现出更强的综合表现力。

为有效利用已有模型的知识积累，团队提出Warmup-Stable-Decay（WSD）持续预训练策略，使LLaDA2.0能够高效继承自回归模型的训练成果，大幅降低从零开始训练所需的时间与资源消耗。在训练方法上，模型融合了置信度感知的并行训练机制（CAP）以及面向扩散结构优化的DPO变体，在确保生成质量的同时，充分释放了扩散模型在并行解码方面的潜力。

最终，LLaDA2.0在实际推理中实现了最高达自回归模型2.1倍的加速效果。这一成果表明，当参数规模达到超大量级时，扩散模型不仅具备技术可行性，更在性能和效率层面展现出超越传统自回归架构的潜力，为未来大模型的发展路径提供了新的方向。

时事资讯

2026-01-05 01:21:01

曝三星正研发新一代 Odyssey OLED G6 显示器：27 英寸 2K 面板，有望明年上市

2026-01-02 08:16:31

5000元显卡推荐

2025-12-28 07:32:10

实探毫末智行北京总部！已人去楼空，有员工抱着显示器离开

2026-01-09 11:56:06

璩静离职百度热搜，新公司已注册

2026-01-07 06:10:00

豆包更新语音对话功能：能讲粤语、四川话等4种方言

2026-01-04 10:37:20

大疆入局 3D打印行业“硝烟”再起

查看更多

科技趋势

时事资讯

单12V-2×6实现为RTX 5090供电750W！甚至都没敢跑分

单12V-2×6实现为RTX 5090供电750W！甚至都没敢跑分

我国新一代太空感知星座发布 156颗卫星组建太空星眼监测空间碎片

我国新一代太空感知星座发布 156颗卫星组建太空星眼监测空间碎片

NVIDIA GPU＋显存不再捆绑强卖！显卡价格生死难料

NVIDIA GPU＋显存不再捆绑强卖！显卡价格生死难料

为什么上班以后越来越胖 5个 “隐形元凶”是关键！

为什么上班以后越来越胖 5个 “隐形元凶”是关键！

飞行速度5-7马赫！四川一民企造出高超音速导弹仅70万元：官方回应基本型已量产

飞行速度5-7马赫！四川一民企造出高超音速导弹仅70万元：官方回应基本型已量产

年产20发！航宇火箭总装智造基地正式投产

年产20发！航宇火箭总装智造基地正式投产

空投利刃砸中必死！央视曝光改装无人机狩猎案

空投利刃砸中必死！央视曝光改装无人机狩猎案

日常维修不求人友福汽修工具套装46件套16.9元大促

日常维修不求人友福汽修工具套装46件套16.9元大促

4699元起华为Mate 80系列开售晨曦金版本成爆款已售罄缺货

4699元起华为Mate 80系列开售晨曦金版本成爆款已售罄缺货

豆包更新语音对话功能：能讲粤语、四川话等4种方言

豆包更新语音对话功能：能讲粤语、四川话等4种方言

查看更多

曝三星正研发新一代 Odyssey OLED G6 显示器：27 英寸 2K 面板，有望明年上市

曝三星正研发新一代 Odyssey OLED G6 显示器：27 英寸 2K 面板，有望明年上市

5000元显卡推荐

5000元显卡推荐

实探毫末智行北京总部！已人去楼空，有员工抱着显示器离开

实探毫末智行北京总部！已人去楼空，有员工抱着显示器离开

璩静离职百度热搜，新公司已注册

璩静离职百度热搜，新公司已注册

豆包更新语音对话功能：能讲粤语、四川话等4种方言

豆包更新语音对话功能：能讲粤语、四川话等4种方言

大疆入局 3D打印行业“硝烟”再起

大疆入局 3D打印行业“硝烟”再起

英伟达：我们为谷歌在 AI 方面的成功而高兴，但现阶段我们的芯片领先一代

英伟达：我们为谷歌在 AI 方面的成功而高兴，但现阶段我们的芯片领先一代

消息称谷歌重启 AI 眼镜：富士康代工、三星设计，最快明年四季度发布

消息称谷歌重启 AI 眼镜：富士康代工、三星设计，最快明年四季度发布

索尼光喻发布LYTIA 901并全面升级命名体系

索尼光喻发布LYTIA 901并全面升级命名体系

话费小额充值消失背后：效率与用户选择权的博弈

话费小额充值消失背后：效率与用户选择权的博弈

查看更多