今天,我们推出了 Gemini 3 Deep Think 的重大升级,这是我们专门的推理模式,旨在应对现代科学、研究和工程中的挑战。此次更新是与科学家和研究人员紧密合作的成果,旨在解决那些缺乏明确界限或单一正确解答的问题,且数据往往杂乱或不完整。通过将深厚的科学知识与日常工程实用性融合,Deep Think 超越了抽象理论,实现了实用应用。
新版本的 Deep Think 现已在 Gemini 应用程序中提供给 Google AI Ultra 订阅用户,并且首次通过 Gemini API 向部分研究人员、工程师和企业开放。以下是早期测试者如何利用最新 Deep Think 的示例:
- Lisa Carbone,来自罗格斯大学的数学家,利用 Deep Think 审查了一篇高能物理学领域的技术数学论文,成功识别出一处在人类同行评审中未被发现的微妙逻辑缺陷。
- 杜克大学的 Wang Lab 利用 Deep Think 优化复杂晶体生长的制造方法,成功设计出一种薄膜生长配方,满足了之前方法难以达到的100 μm的精确目标。
- Google 平台和设备部门的研发负责人 Anupam Pathak 测试了新版本的 Deep Think,加速了物理组件的设计。
提升数学与算法推理
去年,我们展示了 Deep Think 的专业版本成功应对一些最具挑战性的推理问题,在数学和编程世界锦标赛上达到金牌标准。更新后的 Deep Think 继续推动智能的前沿,取得了多个学术基准的新高度,包括:
- 在 Humanity’s Last Exam 上设定了新的标准(48.4%,不使用工具);
- 在 ARC-AGI-2 上达到了前所未有的 84.6%,该成绩经过 ARC 奖学金基金会验证;
- 在 Codeforces 上获得了惊人的 3455 Elo 分数,属于竞争性编程挑战的基准;
- 在 2025 年国际数学奥林匹克中达到金牌水平。
在科学领域的突破
除了数学和竞争编码,Gemini 3 Deep Think 现在在化学和物理等广泛科学领域中也表现出色。在 2025 年国际物理奥林匹克和化学奥林匹克的书面部分中,更新后的 Deep Think 模式展示了金牌水平的结果,并在高级理论物理中获得了 50.5% 的分数。
加速现实工程应用
Deep Think 不仅具备最先进的性能,还致力于推动实用应用,帮助研究人员解读复杂数据,工程师通过代码建模物理系统。最重要的是,我们正努力将 Deep Think 带到研究人员和从业者最需要的地方,首先通过 Gemini API 等界面。
通过更新后的 Deep Think,用户可以将草图转化为可3D打印的现实。Deep Think 分析绘图,建模复杂形状,并生成创建物理对象的3D打印文件。
Google AI Ultra 订阅者今天可以在 Gemini 应用程序中访问更新后的 Deep Think 模式。科学家、工程师和企业也可以通过我们的早期访问程序表达对测试 Deep Think 的兴趣。我们期待看到您的发现。
博主点评: Gemini 3 Deep Think 的更新不仅提升了推理能力,还在实际应用中展现了强大的潜力,尤其是在科学研究和工程设计领域。通过与用户的深度合作,这一工具的实用性和准确性得到了显著增强,值得关注和期待。