摘要
生成高质量的物理文字问题(PWPs),使其既新颖、复杂又可解,仍然是教育内容生成中一个具有挑战性且未被充分探索的问题。现有的方法多为数学文字问题(MWP)生成的改编,常常产生模糊、不可解或结构简单的问题,且语言多样性有限。
我们提出了ARVRE(Agentic Retrieval Value Reinforced Equation-chain),这是一个用于生成多样且数学有效的PWPs的两阶段框架。在第一阶段,采用一种离线时间差分学习方法构建有效的物理方程链,同时,代理检索增强生成(RAG)框架动态选择特定主题的概念和词汇。这种设计使得对问题结构和难度的显式控制成为可能。
在第二阶段,使用大型语言模型(LLM)将方程链和检索到的概念转换为自然语言的物理问题。通过将生成过程基于有效的方程链,我们的方法在促进语言多样性和上下文丰富性的同时,保持了数学的正确性。人类和自动评估表明,ARVRE生成的PWPs比现有方法产生的更复杂、新颖且可解。这些结果突显了结合强化学习、检索和LLM在可靠生成教育物理内容方面的潜力。
博主点评: ARVRE框架通过将强化学习与大型语言模型结合,不仅提升了物理问题生成的质量,还为教育内容创作提供了新的思路,值得进一步探索其在其他学科的应用潜力。