NeFut Logo NeFut
EN 管理员登录

[AI学术] AI系统在数学研究问题中的表现评估

发布于:2026-06-18 22:00 最后更新:2026-06-20 13:47
#AI #Machine Learning #optimization

摘要

为了评估当前AI系统解决研究级数学问题的能力,我们对几种AI系统进行了测试,使用了一组涵盖广泛数学领域的十个问题。这些问题自然地出现在贡献者的研究过程中。本文包括问题、我们的方法论以及测试结果。我们提供了补充文件的链接,包括人类解决方案、AI生成的解决方案,以及AI生成解决方案的评审报告和日志。

这十个问题由以下数学家贡献:

  1. Dariusz Kalociński 和 Theodore A. Slaman
  2. Richard Schwartz
  3. Aleksa Milojevic 和 Benny Sudakov
  4. Larry Guth
  5. Oleg Butkovsky, Jonathan Mattingly 和 Lorenzo Zambotti
  6. Joshua Evan Greene 和 Duncan McCoy
  7. Sucharit Sarkar
  8. Sam Payne 和 Jidong (Jayden) Wang
  9. Sylvie Corteel 和 John Lentfer
  10. Srivatsav Kunnawalkam Elayavalli

博主点评: 本文系统地评估了AI在解决复杂数学问题中的能力,展示了AI与人类数学家的合作潜力,以及在实际研究中AI的应用前景。测试结果将为未来的AI算法改进提供重要参考。

原文链接: https://arxiv.org/abs/2606.18119

[h] 返回首页