NeFut Logo NeFut
EN 管理员登录

[AI造物主] MedGemma:开创医疗AI发展的强大开放模型

发布于:2026-06-15 22:00 最后更新:2026-06-16 12:15
#AI #Machine Learning #Open Source

我们最近推出了MedGemma系列的新多模态模型,这是我们在健康AI开发中最强大的开放模型。随着医疗行业越来越多地采用AI来改善工作流程、患者沟通及诊断与治疗支持,确保这些AI系统不仅高效且保护隐私显得至关重要。为此,我们构建并发布了健康AI开发者基础(HAI-DEF),这是一系列轻量级开放模型,旨在为开发者提供坚实的研究和应用开发起点。

HAI-DEF模型的开放性使开发者完全掌控隐私、基础设施和模型的修改。我们在今年5月扩展了HAI-DEF系列,推出了基于Gemma 3的生成模型MedGemma,以加速医疗和生命科学AI的发展。目前,我们自豪地宣布该系列中新增的两个模型:MedGemma 27B Multimodal和MedSigLIP。

MedGemma 27B Multimodal模型补充了之前发布的4B Multimodal和27B文本模型,增加了对复杂多模态和纵向电子健康记录解读的支持。MedSigLIP则是一个轻量级的图像和文本编码器,适用于分类、搜索等任务,基于支持4B和27B MedGemma模型的图像编码器。

MedGemma和MedSigLIP是医学研究和产品开发的强大起点。MedGemma适用于需要生成自由文本的医学文本或影像任务,如报告生成或视觉问答,而MedSigLIP则推荐用于涉及结构输出的影像任务,如分类或检索。所有这些模型都可以在单个GPU上运行,MedGemma 4B和MedSigLIP甚至可以适应移动硬件。

MedGemma 4B在MedQA上的得分为64.4%,在非常小的开放模型中名列前茅。在一项非盲研究中,81%的MedGemma 4B生成的胸部X射线报告被美国认证放射科医师评估为足够准确,可以实现与原始放射科报告相似的患者管理。MedGemma 27B模型在MedQA医学知识和推理基准测试中的表现也相当优秀。

MedSigLIP是一个仅有400M参数的轻量图像编码器,采用SigLIP架构,通过与多样的医学影像数据进行调优,使模型能够学习到特定模态的细微特征。MedSigLIP旨在将医学图像与医学文本编码到一个共同的嵌入空间,从而实现更高效的分类和检索。

由于MedGemma系列是开放的,开发者可以下载、构建和微调这些模型,以满足特定需求。这种开放的方法在医疗领域提供了多个优势,如灵活性和隐私保护、性能优化和可重复性。我们期待看到开发者利用MedGemma和MedSigLIP创建下一代健康AI工具。

为了帮助开发者入门,我们在GitHub上提供了详细的笔记本,演示如何创建MedSigLIP和MedGemma实例,用于推理和微调。开发者还可以将MedGemma和MedSigLIP无缝部署到Vertex AI中,作为专用端点,并提供了如何在这些端点上运行推理的示例。所有模型的完整信息可以在MedGemma技术报告中找到。

注意,这些模型旨在作为起点,帮助高效开发下游的医疗应用,开发者应对模型输出进行适当的验证和调整,以确保符合具体使用案例的需求。

原文链接: https://deepmind.google/blog/medgemma-our-most-capable-open-models-for-health-ai-development/

[h] 返回首页