2025年8月7日,科学界的最新进展显示,Perch团队推出的新模型帮助保护者更快地分析生物声学数据,以保护从夏威夷蜜雀到珊瑚礁等濒危物种。科学家们通过麦克风(或水下水听器)收集大量音频,这些音频中包含鸟类、青蛙、昆虫、鲸鱼、鱼类等的声音,能够揭示特定区域内动物的种类及生态系统的健康状况。然而,处理如此庞大的数据量依然是一项巨大的挑战。
今天,我们发布了Perch的更新版本,这是一种旨在帮助保护者分析生物声学数据的AI模型。新模型在鸟类物种预测方面表现优于之前的版本,特别是在新环境(如珊瑚礁)中的适应能力更强。它经过更广泛的动物数据训练,包括哺乳动物、两栖动物及人类噪音,数据量几乎是之前的两倍,来源包括Xeno-Canto和iNaturalist等公共资源。新模型能够从数千甚至数百万小时的音频数据中解读复杂的声学场景,能够回答“有多少幼鸟出生”到“特定区域内有多少只动物”等多种问题。
为了帮助科学家保护我们的生态系统,我们将新的Perch版本作为开放模型发布,并在Kaggle上提供。Perch不仅仅能识别鸟类的声音。我们的新模型还经过更广泛动物的训练,包括哺乳动物、两栖动物和人类噪音。
自2023年首次推出以来,Perch的初版已被下载超过250,000次,其开放解决方案已成功整合到生物学工具中。例如,Perch的向量搜索库现已成为康奈尔大学广泛使用的BirdNet Analyzer的一部分。此外,Perch正在帮助BirdLife Australia和澳大利亚声学观测站为多种独特的澳大利亚物种构建分类器。例如,我们的工具帮助发现了难得的平原漫游者新种群。这是一个令人惊叹的发现,声学监测将帮助许多濒危鸟类的未来。
保罗·罗,詹姆斯库克大学研究院,澳大利亚的研究表明,Perch的早期版本可以用来识别个体鸟类并跟踪鸟类数量,从而可能减少监测种群所需的捕捉与释放研究。夏威夷大学的LOHE生物声学实验室的生物学家们使用Perch监测和保护蜜雀种群,这些物种在夏威夷神话中占有重要地位,并因外来蚊子传播的禽流感面临灭绝。Perch帮助LOHE实验室以近50倍于他们通常方法的速度找到蜜雀声音,使他们能够在更大区域内监测更多种类的蜜雀。
Perch模型可以预测录音中存在的物种,但这只是故事的一部分:我们还提供工具,让科学家能够从单个示例快速构建新的分类器,并监测训练数据稀缺或特定声音(如幼鸟叫声)的物种。给定一个声音示例,Perch的向量搜索可以在数据集中找到最相似的声音。地方专家可以将搜索结果标记为相关或不相关,从而训练分类器。这种结合向量搜索和主动学习的强嵌入模型的方法称为敏捷建模。我们最近的论文《寻找叫声:生物声学中的敏捷建模》显示,这种方法适用于鸟类和珊瑚礁,可以在不到一个小时内创建高质量分类器。
展望未来,我们的模型和方法正在帮助最大化保护工作效果,留出更多时间和资源用于有意义的实地工作。从夏威夷的森林到海洋的珊瑚礁,Perch项目展示了我们在应对世界最紧迫挑战时所能产生的深远影响。每一个分类器的构建和每一小时的数据分析都使我们更接近一个充满丰富生物多样性的星球的声音世界。
了解更多信息,下载新的Perch模型,阅读我们的论文以及探索我们的GitHub库。
感谢Perch团队的Bart van Merriënboer、Jenny Hamer、Vincent Dumoulin、Lauren Harrell、Tom Denton和来自谷歌研究的Otilia Stretcu。我们还感谢夏威夷大学的Amanda Navine和Pat Hart,以及康奈尔鸟类学实验室的Holger Klinck、Stefan Kahl和BirdNet团队。还有所有我们的朋友和合作伙伴,如果我们有多出一千个字,我们一定会写到他们。
博主点评: 该模型的推出无疑将推动生物声学研究的前进,利用AI技术快速分析生态系统音频数据,极大提高了保护工作的效率。尤其是新模型的灵活性和开放性,有助于科学家们应对日益严峻的生态环境挑战。期待未来更多的应用与发展!