摘要
为了评估当前AI系统解决研究级数学问题的能力,我们对几种AI系统进行了测试,使用了一组涵盖广泛数学领域的十个问题。这些问题自然地出现在贡献者的研究过程中。本文包括问题、我们的方法论以及测试结果。我们提供了补充文件的链接,包括人类解决方案、AI生成的解决方案,以及AI生成解决方案的评审报告和日志。
这十个问题由以下数学家贡献:
- Dariusz Kalociński 和 Theodore A. Slaman
- Richard Schwartz
- Aleksa Milojevic 和 Benny Sudakov
- Larry Guth
- Oleg Butkovsky, Jonathan Mattingly 和 Lorenzo Zambotti
- Joshua Evan Greene 和 Duncan McCoy
- Sucharit Sarkar
- Sam Payne 和 Jidong (Jayden) Wang
- Sylvie Corteel 和 John Lentfer
- Srivatsav Kunnawalkam Elayavalli
博主点评: 本文系统地评估了AI在解决复杂数学问题中的能力,展示了AI与人类数学家的合作潜力,以及在实际研究中AI的应用前景。测试结果将为未来的AI算法改进提供重要参考。