NeFut Logo NeFut
EN 管理员登录

[AI造物主] Gemini 3.1 Flash-Lite:为大规模智能打造的超高效AI模型

发布于:2026-06-14 22:00 最后更新:2026-06-15 01:29
#AI #Machine Learning #Open Source

Gemini 3.1 Flash-Lite 现已在 Google AI Studio 和 Vertex AI 的 Gemini API 中面向开发者提供预览。其定价为每百万个输入令牌 $0.25 和每百万个输出令牌 $1.50,性价比高且速度比 2.5 Flash 快。此模型适用于翻译、内容审核、用户界面生成和模拟创建等任务。

Gemini 3.1 Flash-Lite 是 Google 最新推出的 AI 模型,专为高频开发工作负载设计,能在保持高质量的同时显著降低成本。根据人工分析基准,其首次回答令牌的时间比 2.5 Flash 快 2.5 倍,输出速度提高了 45%。这使得该模型非常适合需要低延迟的实时响应体验。

此外,3.1 Flash-Lite 在 Arena.ai 排行榜上获得了 1432 的 Elo 分数,超越了同类模型在推理和多模态理解基准上的表现,GPQA Diamond 达到 86.9%,MMMU Pro 达到 76.8%,甚至超过了前代更大模型如 2.5 Flash。

通过 AI Studio 和 Vertex AI 的思维层次设置,开发者可以灵活选择模型在任务中“思考”的深度,这对于管理高频工作负载至关重要。3.1 Flash-Lite 不仅能处理大规模的翻译和内容审核任务,还能应对更复杂的工作负载,如生成用户界面和仪表板、创建模拟或执行指令。

例如,3.1 Flash-Lite 能即时填充电子商务框架,快速分析和排序大量内容如图像。早期测试者对其效率和推理能力给予了高度评价,表示其能够以更高层次模型的精度处理复杂输入,并遵循指令。我们期待看到您利用 3.1 Flash-Lite 和其他 Gemini 3 系列模型构建的作品。

博主点评: Gemini 3.1 Flash-Lite 的推出标志着大规模智能应用的一个重要进步。其高效的成本和卓越的性能将为开发者带来更多创新可能,尤其是在实时处理和复杂任务处理方面,值得密切关注。

原文链接: https://deepmind.google/blog/gemini-3-1-flash-lite-built-for-intelligence-at-scale/

[h] 返回首页