今天,我们推出了Gemma 4——迄今为止我们最智能的开源模型。Gemma 4专为高级推理和自主工作流设计,提供了前所未有的参数智能水平。这一突破基于惊人的社区动能:自首代发布以来,开发者下载Gemma超过4亿次,构建了一个超过10万种变体的活跃生态。我们紧密倾听创新者的需求,Gemma 4就是我们的答案:在Apache 2.0许可证下广泛可用的突破性能力。
Gemma 4家族包括四种灵活的型号:有效的2B(E2B)、有效的4B(E4B)、26B专家混合(MoE)和31B稠密模型。整个系列超越了简单的对话,能够处理复杂的逻辑和自主工作流。我们的较大模型在其尺寸上提供了最先进的性能,目前31B模型在行业标准的Arena AI文本排行榜上排名第三,26B模型则位列第六。在这里,Gemma 4的表现超越了其规模20倍的模型。
对于开发者来说,这种新的参数智能水平意味着在显著减少硬件开销的情况下实现前沿能力。在边缘设备上,我们的E2B和E4B模型重新定义了设备的实用性,优先考虑多模态能力、低延迟处理和无缝生态系统集成,而非仅仅参数数量。
Gemma 4模型的设计旨在高效运行和微调,从全球数十亿台Android设备到笔记本GPU,再到开发者工作站和加速器。通过使用这些高度优化的模型,您可以微调Gemma 4以在特定任务中实现最先进的性能。
以下是Gemma 4成为我们最强大的开源模型家族的原因:
- 高级推理:具备多步规划和深度逻辑能力,Gemma 4在数学和指令跟随基准测试中表现出显著提升。
- 自主工作流:原生支持功能调用、结构化JSON输出和本地系统指令,能够构建与不同工具和API交互的自主代理。
- 代码生成:Gemma 4支持高质量的离线代码,将您的工作站转变为本地首选的AI代码助手。
- 视觉和音频:所有模型原生处理视频和图像,支持可变分辨率,并在OCR和图表理解等视觉任务中表现出色。
- 更长的上下文:无缝处理长格式内容。边缘模型具有128K上下文窗口,而较大模型提供高达256K的上下文,允许您一次性传递仓库或长文档。
- 140多种语言:原生训练于超过140种语言,Gemma 4帮助开发者构建面向全球受众的包容性高性能应用。
我们将Gemma 4模型权重以适合特定硬件和用例的尺寸发布,确保无论您需要何种推理能力,都能获得前沿的智能。Gemma 4的开源许可证为开发者提供了完全的灵活性和数字主权,使您能够自由构建和安全部署。
通过选择Gemma 4,企业和主权组织获得了一个值得信赖的基础,提供最先进的能力,同时满足最高的安全和可靠性标准。
开始实验:立即获取Gemma 4并开始构建。探索Gemma 4在Google AI Studio中的应用,或在Google AI Edge Gallery中使用E4B和E2B。Android开发者可以在Android Studio中使用它来推动Agent Mode,开始为Android构建生产应用。使用您喜欢的工具,从Hugging Face到Docker,选择最佳工具来满足您的项目需求。通过Google Cloud扩展到生产环境,移除所有计算限制。Gemma 4在多种硬件平台上优化,提供卓越的性能。
博主点评: Gemma 4的发布标志着开源AI模型的又一次重大进步,其在多模态处理和高效推理方面的能力将极大地推动开发者的创新潜力。通过开放的Apache 2.0许可证,Gemma 4不仅降低了进入门槛,还促使了更广泛的应用场景和生态系统的发展。其灵活性和强大的硬件兼容性将使其在未来的应用中发挥关键作用。