[AI造物主] Gemini 3.1 Flash-Lite：为大规模智能打造的超高效AI模型

Gemini 3.1 Flash-Lite 现已在 Google AI Studio 和 Vertex AI 的 Gemini API 中面向开发者提供预览。其定价为每百万个输入令牌 $0.25 和每百万个输出令牌 $1.50，性价比高且速度比 2.5 Flash 快。此模型适用于翻译、内容审核、用户界面生成和模拟创建等任务。

Gemini 3.1 Flash-Lite 是 Google 最新推出的 AI 模型，专为高频开发工作负载设计，能在保持高质量的同时显著降低成本。根据人工分析基准，其首次回答令牌的时间比 2.5 Flash 快 2.5 倍，输出速度提高了 45%。这使得该模型非常适合需要低延迟的实时响应体验。

此外，3.1 Flash-Lite 在 Arena.ai 排行榜上获得了 1432 的 Elo 分数，超越了同类模型在推理和多模态理解基准上的表现，GPQA Diamond 达到 86.9%，MMMU Pro 达到 76.8%，甚至超过了前代更大模型如 2.5 Flash。

通过 AI Studio 和 Vertex AI 的思维层次设置，开发者可以灵活选择模型在任务中“思考”的深度，这对于管理高频工作负载至关重要。3.1 Flash-Lite 不仅能处理大规模的翻译和内容审核任务，还能应对更复杂的工作负载，如生成用户界面和仪表板、创建模拟或执行指令。

例如，3.1 Flash-Lite 能即时填充电子商务框架，快速分析和排序大量内容如图像。早期测试者对其效率和推理能力给予了高度评价，表示其能够以更高层次模型的精度处理复杂输入，并遵循指令。我们期待看到您利用 3.1 Flash-Lite 和其他 Gemini 3 系列模型构建的作品。

博主点评： Gemini 3.1 Flash-Lite 的推出标志着大规模智能应用的一个重要进步。其高效的成本和卓越的性能将为开发者带来更多创新可能，尤其是在实时处理和复杂任务处理方面，值得密切关注。