今天,我们发布了Gemini 2.5 Flash-Lite的稳定版本,这是我们在Gemini 2.5模型家族中速度最快、成本最低的模型(每百万输入$0.10,每百万输出$0.40)。我们构建2.5 Flash-Lite旨在推动每美元的智能前沿,其原生推理能力可选开启,适用于更高要求的用例。
核心亮点
- 最佳速度:Gemini 2.5 Flash-Lite在广泛的提示样本上,其延迟低于2.0 Flash-Lite和2.0 Flash。
- 成本效益:作为我们迄今为止最低成本的2.5模型,售价为每百万输入标记$0.10和输出标记$0.40,支持处理大量请求。
- 智能小巧:在编码、数学、科学、推理和多模态理解等多项基准测试中,其整体质量高于2.0 Flash-Lite。
- 全功能:使用2.5 Flash-Lite时,您可以访问1百万标记的上下文窗口、可控的思维预算,并支持Google搜索、代码执行和URL上下文等原生工具。
实际应用案例
自2.5 Flash-Lite发布以来,我们已经见证了一些成功的应用案例:
- Satlyt:构建去中心化的空间计算平台,利用2.5 Flash-Lite实现关键在轨诊断的延迟减少45%以及功耗降低30%。
- HeyGen:利用AI创建视频内容的头像,借助2.5 Flash-Lite自动化视频规划并翻译视频至180多种语言。
- DocsHound:将产品演示转化为文档,使用2.5 Flash-Lite处理长视频并提取屏幕截图,显著加快文档生成速度。
- Evertune:通过Gemini 2.5 Flash-Lite加速对AI模型输出的分析和报告生成,提供动态、及时的客户洞察。
您可以通过在代码中指定“gemini-2.5-flash-lite”开始使用2.5 Flash-Lite。如果您使用的是预览版本,可以切换到“gemini-2.5-flash-lite”。我们计划在8月25日前移除Flash-Lite的预览别名。准备开始构建了吗?现在可以在Google AI Studio和Vertex AI中试用稳定版本的Gemini 2.5 Flash-Lite。
博主点评: Gemini 2.5 Flash-Lite的推出标志着AI模型在成本与性能上的重要平衡,尤其适合需要高效处理的应用场景。这一模型的低延迟和高效能将极大推动各行业的创新,值得开发者积极探索与应用。