在人工智能领域,科学自动化一直是一个长期的追求。尽管社区在自动化科学过程的各个组成部分上取得了显著进展,但一个能够自主导航整个研究生命周期的系统——从构想到发表——仍然遥不可及。本文介绍了迄今为止在全流程自动化方面最强有力的演示:人工智能科学家(The AI Scientist)。
该系统能够创建研究想法、编写代码、运行实验、绘制和分析数据、撰写完整的科学手稿,并进行自我同行评审。其生成的想法、执行和展示质量足以使由AI系统生成的手稿通过主要机器学习会议研讨会的首次同行评审,该研讨会的录取率为70%。
该系统利用现代基础模型构建了一个复杂的自主代理系统。我们在两个环境中评估了人工智能科学家:一种是聚焦模式,使用人类提供的代码模板作为初步框架,以便在特定主题上进行研究;另一种是无模板的开放模式,利用自主搜索进行更广泛的科学探索。两种模式均能产生多样化的想法,并自动测试、报告和评估这些想法。
这一成就展示了人工智能在科学贡献方面日益增长的能力,并标志着研究开展方式的潜在范式转变。与任何有影响力的新技术一样,可能会存在显著风险,包括对过度负担的评审系统的影响以及对科学文献的噪声增加。然而,如果负责任地开发,这类自主系统将极大加速科学发现。
博主点评: 该研究展示了人工智能在科学研究中的巨大潜力,尤其是在自动化和效率方面。然而,如何平衡自动化带来的便利与学术界的传统审查机制之间的冲突,将是未来必须解决的重要课题。