[AI学术] 突破性的物理问题生成框架：ARVRE的应用与创新

摘要

生成高质量的物理文字问题（PWPs），使其既新颖、复杂又可解，仍然是教育内容生成中一个具有挑战性且未被充分探索的问题。现有的方法多为数学文字问题（MWP）生成的改编，常常产生模糊、不可解或结构简单的问题，且语言多样性有限。

我们提出了ARVRE（Agentic Retrieval Value Reinforced Equation-chain），这是一个用于生成多样且数学有效的PWPs的两阶段框架。在第一阶段，采用一种离线时间差分学习方法构建有效的物理方程链，同时，代理检索增强生成（RAG）框架动态选择特定主题的概念和词汇。这种设计使得对问题结构和难度的显式控制成为可能。

在第二阶段，使用大型语言模型（LLM）将方程链和检索到的概念转换为自然语言的物理问题。通过将生成过程基于有效的方程链，我们的方法在促进语言多样性和上下文丰富性的同时，保持了数学的正确性。人类和自动评估表明，ARVRE生成的PWPs比现有方法产生的更复杂、新颖且可解。这些结果突显了结合强化学习、检索和LLM在可靠生成教育物理内容方面的潜力。

博主点评： ARVRE框架通过将强化学习与大型语言模型结合，不仅提升了物理问题生成的质量，还为教育内容创作提供了新的思路，值得进一步探索其在其他学科的应用潜力。