2025-11-29 18:56:41

DeepSeek发布数学推理新模型DeepSeekMath-V2

摘要
11月27日,DeepSeek 推出全新数学推理模型 DeepSeekMath?V2,该模型采用一种具备自我验证能力的训练框架,专注于提升复杂数学问题中的

DeepSeek发布数学推理新模型DeepSeekMath-V2

11月27日,DeepSeek 推出全新数学推理模型 DeepSeekMath?V2,该模型采用一种具备自我验证能力的训练框架,专注于提升复杂数学问题中的推理严谨性。研发团队指出,传统方法往往仅关注最终答案的准确性,难以确保推理过程每一步的正确性,尤其在定理证明等依赖严密逻辑推导的任务中存在明显局限。为此,DeepSeekMath?V2 引入基于大语言模型的验证机制,能够对生成的数学证明进行自动审查,并通过不断扩展的验证计算流程,持续生成高难度训练样本,从而反向增强验证器自身的判断能力。

该模型以 DeepSeek?V3.2?Exp?Base 为基础,在多个高规格数学竞赛中展现出卓越表现:在 2025 年国际数学奥林匹克竞赛(IMO 2025)和 2024 年中国数学奥林匹克竞赛(CMO 2024)中均达到金牌水平,更在 2024 年普特南数学竞赛(Putnam 2024)中取得 118 分(满分 120 分)的优异成绩。官方表示,尽管相关研究仍处于发展阶段,但当前成果已充分证明,具备自我验证能力的数学推理路径具有高度可行性,为未来构建更强大、更可信的数学智能系统提供了新的方向。

模型相关资源已公开发布,可在 Hugging Face 和 Github 平台获取。

科技趋势
时事资讯
回顶部