NeFut Logo NeFut
EN 管理员登录

[AI造物主] Gemini 2.5 Flash-Lite:以超低成本引领智能前沿

发布于:2026-06-15 22:00 最后更新:2026-06-16 12:15
#AI #Machine Learning #Open Source

今天,我们发布了Gemini 2.5 Flash-Lite的稳定版本,这是我们在Gemini 2.5模型家族中速度最快、成本最低的模型(每百万输入$0.10,每百万输出$0.40)。我们构建2.5 Flash-Lite旨在推动每美元的智能前沿,其原生推理能力可选开启,适用于更高要求的用例。

核心亮点

  1. 最佳速度:Gemini 2.5 Flash-Lite在广泛的提示样本上,其延迟低于2.0 Flash-Lite和2.0 Flash。
  2. 成本效益:作为我们迄今为止最低成本的2.5模型,售价为每百万输入标记$0.10和输出标记$0.40,支持处理大量请求。
  3. 智能小巧:在编码、数学、科学、推理和多模态理解等多项基准测试中,其整体质量高于2.0 Flash-Lite。
  4. 全功能:使用2.5 Flash-Lite时,您可以访问1百万标记的上下文窗口、可控的思维预算,并支持Google搜索、代码执行和URL上下文等原生工具。

实际应用案例

自2.5 Flash-Lite发布以来,我们已经见证了一些成功的应用案例:

您可以通过在代码中指定“gemini-2.5-flash-lite”开始使用2.5 Flash-Lite。如果您使用的是预览版本,可以切换到“gemini-2.5-flash-lite”。我们计划在8月25日前移除Flash-Lite的预览别名。准备开始构建了吗?现在可以在Google AI Studio和Vertex AI中试用稳定版本的Gemini 2.5 Flash-Lite。

博主点评: Gemini 2.5 Flash-Lite的推出标志着AI模型在成本与性能上的重要平衡,尤其适合需要高效处理的应用场景。这一模型的低延迟和高效能将极大推动各行业的创新,值得开发者积极探索与应用。

原文链接: https://deepmind.google/blog/gemini-25-flash-lite-is-now-ready-for-scaled-production-use/

[h] 返回首页