[AI造物主] MedGemma：开创医疗AI发展的强大开放模型

我们最近推出了MedGemma系列的新多模态模型，这是我们在健康AI开发中最强大的开放模型。随着医疗行业越来越多地采用AI来改善工作流程、患者沟通及诊断与治疗支持，确保这些AI系统不仅高效且保护隐私显得至关重要。为此，我们构建并发布了健康AI开发者基础（HAI-DEF），这是一系列轻量级开放模型，旨在为开发者提供坚实的研究和应用开发起点。

HAI-DEF模型的开放性使开发者完全掌控隐私、基础设施和模型的修改。我们在今年5月扩展了HAI-DEF系列，推出了基于Gemma 3的生成模型MedGemma，以加速医疗和生命科学AI的发展。目前，我们自豪地宣布该系列中新增的两个模型：MedGemma 27B Multimodal和MedSigLIP。

MedGemma 27B Multimodal模型补充了之前发布的4B Multimodal和27B文本模型，增加了对复杂多模态和纵向电子健康记录解读的支持。MedSigLIP则是一个轻量级的图像和文本编码器，适用于分类、搜索等任务，基于支持4B和27B MedGemma模型的图像编码器。

MedGemma和MedSigLIP是医学研究和产品开发的强大起点。MedGemma适用于需要生成自由文本的医学文本或影像任务，如报告生成或视觉问答，而MedSigLIP则推荐用于涉及结构输出的影像任务，如分类或检索。所有这些模型都可以在单个GPU上运行，MedGemma 4B和MedSigLIP甚至可以适应移动硬件。

MedGemma 4B在MedQA上的得分为64.4%，在非常小的开放模型中名列前茅。在一项非盲研究中，81%的MedGemma 4B生成的胸部X射线报告被美国认证放射科医师评估为足够准确，可以实现与原始放射科报告相似的患者管理。MedGemma 27B模型在MedQA医学知识和推理基准测试中的表现也相当优秀。

MedSigLIP是一个仅有400M参数的轻量图像编码器，采用SigLIP架构，通过与多样的医学影像数据进行调优，使模型能够学习到特定模态的细微特征。MedSigLIP旨在将医学图像与医学文本编码到一个共同的嵌入空间，从而实现更高效的分类和检索。

由于MedGemma系列是开放的，开发者可以下载、构建和微调这些模型，以满足特定需求。这种开放的方法在医疗领域提供了多个优势，如灵活性和隐私保护、性能优化和可重复性。我们期待看到开发者利用MedGemma和MedSigLIP创建下一代健康AI工具。

为了帮助开发者入门，我们在GitHub上提供了详细的笔记本，演示如何创建MedSigLIP和MedGemma实例，用于推理和微调。开发者还可以将MedGemma和MedSigLIP无缝部署到Vertex AI中，作为专用端点，并提供了如何在这些端点上运行推理的示例。所有模型的完整信息可以在MedGemma技术报告中找到。

注意，这些模型旨在作为起点，帮助高效开发下游的医疗应用，开发者应对模型输出进行适当的验证和调整，以确保符合具体使用案例的需求。