[AI造物主] Gemini 2.5：思维模型家族的重大更新

今天，我们很高兴地分享有关Gemini 2.5模型家族的全面更新：

Gemini 2.5 Pro 现已稳定发布，未发生变化（与06-05预览版相同）。
Gemini 2.5 Flash 现已稳定发布，未发生变化（与05-20预览版相同，具体定价请见下文）。
Gemini 2.5 Flash-Lite 现已进入预览阶段。

Gemini 2.5模型是思维模型，能够在响应之前进行推理，从而提升性能和准确性。每个模型都可以控制思维预算，使开发者能够选择模型在生成响应之前“思考”的时机和程度。

Gemini 2.5 Flash-Lite介绍

今天，我们推出了2.5 Flash-Lite预览版，它在2.5模型家族中具有最低的延迟和成本。它被设计为我们之前1.5和2.0 Flash模型的经济型升级，提供更好的性能，并在大多数评估中表现优异，首次令牌生成时间更短，同时每秒解码的令牌数更高。该模型非常适合高吞吐量的任务，如分类或大规模摘要。

2.5 Flash-Lite是一个推理模型，允许通过API参数动态控制思维预算。由于Flash-Lite针对成本和速度进行了优化，因此默认情况下“思考”是关闭的，与我们的其他模型不同。2.5 Flash-Lite还支持所有原生工具，如与Google搜索的连接、代码执行以及URL上下文，此外还支持函数调用。

Gemini 2.5 Flash及定价更新

在过去的一年中，我们的研究团队不断推动Flash模型系列的Pareto前沿。最初宣布2.5 Flash时，我们尚未最终确定2.5 Flash-Lite的功能。我们还推出了“思考”和“非思考”定价，这导致开发者感到困惑。随着稳定版本Gemini 2.5 Flash的推出（与在Google I/O上提供的05-20模型预览版相同），我们更新了2.5 Flash的定价：

$0.30 / 1M输入令牌（*上调自$0.15输入）
$2.50 / 1M输出令牌（*下调自$3.50输出）

我们取消了思考与非思考的价格差异，保持单一价格等级，不论输入令牌大小。尽管我们努力在预览版和稳定版之间保持一致定价以减少干扰，这一特定调整反映了Flash的卓越价值，仍然提供最佳的每智能成本。

Gemini 2.5 Pro的持续增长

对Gemini 2.5 Pro的需求持续增长，成为我们所有模型中增长最快的。为了让更多客户在生产中使用该模型，我们使06-05版本稳定，保持之前的Pareto前沿价格点。我们预计在需要最高智能和最多功能的情况下，Pro会表现得尤为出色，例如在编码和自主任务中。

如果您正在使用2.5 Pro预览版05-06，该模型将于2025年6月19日之前保持可用，然后将被关闭。如果您正在使用2.5 Pro预览版06-05，您可以简单地将模型字符串更新为“gemini-2.5-pro”。我们期待看到更多领域受益于2.5 Pro的智能，并期待在不久的将来分享有关Pro以外的扩展更多的信息。

博主点评： Gemini 2.5系列的更新展现了DeepMind在推理模型领域的持续创新，尤其是Flash-Lite的推出，极大地提高了效率和成本效益，为开发者提供了更多选择，适应不同的应用场景。这种灵活性将进一步推动AI模型在实际应用中的普及和发展。