2025-12-18 12:01:57

谷歌推Gemini 3 Deep Think模式，高端AI竞争升温

摘要

12月5日，有科技媒体发布最新动态，谷歌已为其高级订阅服务 Gemini Ultra 用户推出名为 Gemini 3 Deep Think 的全新“深度思考”

12月5日，有科技媒体发布最新动态，谷歌已为其高级订阅服务 Gemini Ultra 用户推出名为 Gemini 3 Deep Think 的全新“深度思考”模式。该订阅服务每月费用为249.99美元。

与现有的 Gemini 3 Pro 模型相比，Deep Think 模式在运行中调用更多计算资源，并采用全新的技术架构，旨在提升复杂任务下的推理表现。目前，该功能已全面整合至 Gemini 移动应用中。订阅用户从即日起可在输入提示时选择启用“Deep Think”模式，与 Gemini 3 Pro 配合使用，以获得更强的分析与推导能力。

据官方披露的数据，Deep Think 在处理高阶数学、科学问题及逻辑推理任务方面展现出显著进步。在一项被广泛认为极具挑战性的综合测评 Humanity’s Last Exam 中，该模型取得了41%的得分，刷新了当前行业纪录。此外，在 GPQA Diamond 科学知识评估中，其准确率达到93.8%；在涵盖代码执行能力的 ARC-AGI-2 测试中也获得了45.1%的成绩，整体性能达到当前业界领先水平。

这一突破背后的关键技术是先进的并行推理机制（Advanced Parallel Reasoning），使模型能够在同一时间探索多条推理路径，从而更高效地锁定最优解答方案。此前，该模型的测试版本已在国际数学奥林匹克竞赛（IMO）和国际大学生程序设计竞赛（ICPC）世界总决赛等顶级赛事模拟环境中达到“金牌水准”。尤其是在模拟 IMO 的严苛条件下，模型需在无网络连接和外部工具支持的情况下，于两个各4.5小时的考试周期内独立完成题目求解并生成完整的自然语言证明过程。

此次正式上线被视为谷歌在人工智能高端竞争中的重要一步。此前有公司曾在7月宣布其实验性推理模型达到类似竞赛的金牌水平，但至今未向公众开放体验。谷歌率先将具备同等能力的系统投入实际应用，引发业内广泛关注。分析普遍认为，此举可能加速推动其他主要厂商加快相关技术的产品化进程，预示着大模型在高阶推理能力方面的竞争将进一步加剧。