[AI造物主] Gemini 2.5 Flash-Lite：以超低成本引领智能前沿

今天，我们发布了Gemini 2.5 Flash-Lite的稳定版本，这是我们在Gemini 2.5模型家族中速度最快、成本最低的模型（每百万输入$0.10，每百万输出$0.40）。我们构建2.5 Flash-Lite旨在推动每美元的智能前沿，其原生推理能力可选开启，适用于更高要求的用例。

核心亮点

最佳速度：Gemini 2.5 Flash-Lite在广泛的提示样本上，其延迟低于2.0 Flash-Lite和2.0 Flash。
成本效益：作为我们迄今为止最低成本的2.5模型，售价为每百万输入标记$0.10和输出标记$0.40，支持处理大量请求。
智能小巧：在编码、数学、科学、推理和多模态理解等多项基准测试中，其整体质量高于2.0 Flash-Lite。
全功能：使用2.5 Flash-Lite时，您可以访问1百万标记的上下文窗口、可控的思维预算，并支持Google搜索、代码执行和URL上下文等原生工具。

实际应用案例

自2.5 Flash-Lite发布以来，我们已经见证了一些成功的应用案例：

Satlyt：构建去中心化的空间计算平台，利用2.5 Flash-Lite实现关键在轨诊断的延迟减少45%以及功耗降低30%。
HeyGen：利用AI创建视频内容的头像，借助2.5 Flash-Lite自动化视频规划并翻译视频至180多种语言。
DocsHound：将产品演示转化为文档，使用2.5 Flash-Lite处理长视频并提取屏幕截图，显著加快文档生成速度。
Evertune：通过Gemini 2.5 Flash-Lite加速对AI模型输出的分析和报告生成，提供动态、及时的客户洞察。

您可以通过在代码中指定“gemini-2.5-flash-lite”开始使用2.5 Flash-Lite。如果您使用的是预览版本，可以切换到“gemini-2.5-flash-lite”。我们计划在8月25日前移除Flash-Lite的预览别名。准备开始构建了吗？现在可以在Google AI Studio和Vertex AI中试用稳定版本的Gemini 2.5 Flash-Lite。

博主点评： Gemini 2.5 Flash-Lite的推出标志着AI模型在成本与性能上的重要平衡，尤其适合需要高效处理的应用场景。这一模型的低延迟和高效能将极大推动各行业的创新，值得开发者积极探索与应用。