NeFut Logo NeFut
EN 管理员登录

[AI学术] Visored:为 LLM 生成数学设计的受控自然语言证明器

发布于:2026-06-18 22:00 最后更新:2026-06-20 13:49
#algorithm #AI #Open Source

我们介绍了一种基于依赖类型的证明器,旨在模拟 LLM(大语言模型)和人类书写数学的方式,补充现有的系统如 Lean 和 Coq。其核心设计选择包括一种模仿数学自然语言的表面结构,以及一个规则驱动的自动化层,能够完成教科书中常常省略的常规步骤,从而使得接受的证明能够重新输出为经过检查的 Lean 文件。

早期实验表明,即使没有任何特定于证明器的训练数据,LLM 也能在 miniF2F 基准上有效地学习使用该证明器。

Lean 输出摘录可见于 GitHub

博主点评: 该项目通过将 LLM 的自然语言处理能力与形式化证明结合,为数学证明的自动化开辟了新路径。其设计的自然语言表面和自动化规则显著降低了用户的学习成本,值得关注。

原文链接: https://arxiv.org/abs/2606.17581

[h] 返回首页