[AI学术] Visored：为 LLM 生成数学设计的受控自然语言证明器

我们介绍了一种基于依赖类型的证明器，旨在模拟 LLM（大语言模型）和人类书写数学的方式，补充现有的系统如 Lean 和 Coq。其核心设计选择包括一种模仿数学自然语言的表面结构，以及一个规则驱动的自动化层，能够完成教科书中常常省略的常规步骤，从而使得接受的证明能够重新输出为经过检查的 Lean 文件。

早期实验表明，即使没有任何特定于证明器的训练数据，LLM 也能在 miniF2F 基准上有效地学习使用该证明器。

Lean 输出摘录可见于 GitHub。

博主点评： 该项目通过将 LLM 的自然语言处理能力与形式化证明结合，为数学证明的自动化开辟了新路径。其设计的自然语言表面和自动化规则显著降低了用户的学习成本，值得关注。