NeFut Logo NeFut
EN 管理员登录

[AI造物主] Gemini 2.5:思维模型家族的重大更新

发布于:2026-06-15 22:00 最后更新:2026-06-16 12:15
#AI #Machine Learning #DeepSeek

今天,我们很高兴地分享有关Gemini 2.5模型家族的全面更新:

Gemini 2.5模型是思维模型,能够在响应之前进行推理,从而提升性能和准确性。每个模型都可以控制思维预算,使开发者能够选择模型在生成响应之前“思考”的时机和程度。

Gemini 2.5 Flash-Lite介绍

今天,我们推出了2.5 Flash-Lite预览版,它在2.5模型家族中具有最低的延迟和成本。它被设计为我们之前1.5和2.0 Flash模型的经济型升级,提供更好的性能,并在大多数评估中表现优异,首次令牌生成时间更短,同时每秒解码的令牌数更高。该模型非常适合高吞吐量的任务,如分类或大规模摘要。

2.5 Flash-Lite是一个推理模型,允许通过API参数动态控制思维预算。由于Flash-Lite针对成本和速度进行了优化,因此默认情况下“思考”是关闭的,与我们的其他模型不同。2.5 Flash-Lite还支持所有原生工具,如与Google搜索的连接、代码执行以及URL上下文,此外还支持函数调用。

Gemini 2.5 Flash及定价更新

在过去的一年中,我们的研究团队不断推动Flash模型系列的Pareto前沿。最初宣布2.5 Flash时,我们尚未最终确定2.5 Flash-Lite的功能。我们还推出了“思考”和“非思考”定价,这导致开发者感到困惑。随着稳定版本Gemini 2.5 Flash的推出(与在Google I/O上提供的05-20模型预览版相同),我们更新了2.5 Flash的定价:

我们取消了思考与非思考的价格差异,保持单一价格等级,不论输入令牌大小。尽管我们努力在预览版和稳定版之间保持一致定价以减少干扰,这一特定调整反映了Flash的卓越价值,仍然提供最佳的每智能成本。

Gemini 2.5 Pro的持续增长

对Gemini 2.5 Pro的需求持续增长,成为我们所有模型中增长最快的。为了让更多客户在生产中使用该模型,我们使06-05版本稳定,保持之前的Pareto前沿价格点。我们预计在需要最高智能和最多功能的情况下,Pro会表现得尤为出色,例如在编码和自主任务中。

如果您正在使用2.5 Pro预览版05-06,该模型将于2025年6月19日之前保持可用,然后将被关闭。如果您正在使用2.5 Pro预览版06-05,您可以简单地将模型字符串更新为“gemini-2.5-pro”。我们期待看到更多领域受益于2.5 Pro的智能,并期待在不久的将来分享有关Pro以外的扩展更多的信息。

博主点评: Gemini 2.5系列的更新展现了DeepMind在推理模型领域的持续创新,尤其是Flash-Lite的推出,极大地提高了效率和成本效益,为开发者提供了更多选择,适应不同的应用场景。 这种灵活性将进一步推动AI模型在实际应用中的普及和发展。

原文链接: https://deepmind.google/blog/gemini-25-updates-to-our-family-of-thinking-models/

[h] 返回首页