2026-01-02 16:33:44

蚂蚁发布千亿元级LLaDA2.0扩散大模型

摘要

12月12日，蚂蚁技术研究院正式发布LLaDA2 0系列离散扩散大语言模型（dLLM），并同步公开了相关技术报告，宣布其为业内首个参数规模达到10

蚂蚁发布千亿元级LLaDA2.0扩散大模型

12月12日，蚂蚁技术研究院正式发布LLaDA2.0系列离散扩散大语言模型（dLLM），并同步公开了相关技术报告，宣布其为业内首个参数规模达到1000亿级别的扩散语言模型。

LLaDA2.0包含基于MoE架构的两个版本：16B mini与100B flash，首次将Diffusion模型的参数量级拓展至100B以上。此次发布打破了扩散模型难以扩展的传统认知，在代码生成、数学推理以及智能体任务等关键领域，展现出优于同级别自回归模型（AR）的能力表现。

通过创新提出的Warmup-Stable-Decay（WSD）持续预训练策略，LLaDA2.0实现了对现有自回归模型知识的有效继承，显著降低了从零开始训练带来的资源消耗。在此基础上，结合置信度感知并行训练（CAP）和专为扩散模型设计的DPO优化方法，不仅确保了生成内容的质量稳定性，还充分利用扩散模型的并行解码特性，在推理速度上相较传统AR模型提升达2.1倍，验证了超大规模参数下扩散模型在性能和效率上的双重优势。

研究团队在知识理解、数学、代码、推理及智能体等多个维度对模型进行了系统评估。结果表明，LLaDA2.0在结构化文本生成任务如编程代码方面表现尤为突出，同时在其他通用能力维度上可与主流开源自回归模型相媲美。

目前，LLaDA2.0的模型权重（涵盖16B与100B版本）及配套训练代码已全部开放，相关资源可在Huggingface平台获取。

时事资讯

2026-01-05 01:21:01

曝三星正研发新一代 Odyssey OLED G6 显示器：27 英寸 2K 面板，有望明年上市

2026-01-02 08:16:31

5000元显卡推荐

2025-12-28 07:32:10

实探毫末智行北京总部！已人去楼空，有员工抱着显示器离开

2026-01-09 11:56:06

璩静离职百度热搜，新公司已注册

2026-01-07 06:10:00

豆包更新语音对话功能：能讲粤语、四川话等4种方言

2026-01-04 10:37:20

大疆入局 3D打印行业“硝烟”再起

查看更多

科技趋势

时事资讯

单12V-2×6实现为RTX 5090供电750W！甚至都没敢跑分

单12V-2×6实现为RTX 5090供电750W！甚至都没敢跑分

我国新一代太空感知星座发布 156颗卫星组建太空星眼监测空间碎片

我国新一代太空感知星座发布 156颗卫星组建太空星眼监测空间碎片

NVIDIA GPU＋显存不再捆绑强卖！显卡价格生死难料

NVIDIA GPU＋显存不再捆绑强卖！显卡价格生死难料

为什么上班以后越来越胖 5个 “隐形元凶”是关键！

为什么上班以后越来越胖 5个 “隐形元凶”是关键！

飞行速度5-7马赫！四川一民企造出高超音速导弹仅70万元：官方回应基本型已量产

飞行速度5-7马赫！四川一民企造出高超音速导弹仅70万元：官方回应基本型已量产

年产20发！航宇火箭总装智造基地正式投产

年产20发！航宇火箭总装智造基地正式投产

空投利刃砸中必死！央视曝光改装无人机狩猎案

空投利刃砸中必死！央视曝光改装无人机狩猎案

日常维修不求人友福汽修工具套装46件套16.9元大促

日常维修不求人友福汽修工具套装46件套16.9元大促

4699元起华为Mate 80系列开售晨曦金版本成爆款已售罄缺货

4699元起华为Mate 80系列开售晨曦金版本成爆款已售罄缺货

豆包更新语音对话功能：能讲粤语、四川话等4种方言

豆包更新语音对话功能：能讲粤语、四川话等4种方言

查看更多

曝三星正研发新一代 Odyssey OLED G6 显示器：27 英寸 2K 面板，有望明年上市

曝三星正研发新一代 Odyssey OLED G6 显示器：27 英寸 2K 面板，有望明年上市

5000元显卡推荐

5000元显卡推荐

实探毫末智行北京总部！已人去楼空，有员工抱着显示器离开

实探毫末智行北京总部！已人去楼空，有员工抱着显示器离开

璩静离职百度热搜，新公司已注册

璩静离职百度热搜，新公司已注册

豆包更新语音对话功能：能讲粤语、四川话等4种方言

豆包更新语音对话功能：能讲粤语、四川话等4种方言

大疆入局 3D打印行业“硝烟”再起

大疆入局 3D打印行业“硝烟”再起

英伟达：我们为谷歌在 AI 方面的成功而高兴，但现阶段我们的芯片领先一代

英伟达：我们为谷歌在 AI 方面的成功而高兴，但现阶段我们的芯片领先一代

消息称谷歌重启 AI 眼镜：富士康代工、三星设计，最快明年四季度发布

消息称谷歌重启 AI 眼镜：富士康代工、三星设计，最快明年四季度发布

索尼光喻发布LYTIA 901并全面升级命名体系

索尼光喻发布LYTIA 901并全面升级命名体系

话费小额充值消失背后：效率与用户选择权的博弈

话费小额充值消失背后：效率与用户选择权的博弈

查看更多