[AI学术] 警惕伪科学：PseudoBench 测试自主研究系统的抗伪能力

随着基于大型语言模型的自主研究代理进入科学研究领域，抵制伪科学的能力变得愈发重要。否则，这些系统可能迅速生成看似合理但误导性的研究，污染学术文献并侵蚀公众对科学的信任。我们提出了 PseudoBench，这是一个评估自主研究系统识别和抵制伪科学叙述能力的对抗性基准。

PseudoBench 包含 200 对经过筛选的伪科学主张与证据，涵盖五个领域，并通过从实验到写作的端到端研究流程来评估代理的表现。我们测试了七个最先进的代理，发现当前系统容易生成与伪科学前提一致的有说服力的报告，拒绝率近乎为零，最高抵制率仅为 27.4%。更强大的代理可能将伪科学包装为更复杂的科学语言，从而提高其表面可信度。这些发现揭示了助长伪科学的令人担忧的能力，呼吁在广泛部署之前进行科学对齐。

博主点评： PseudoBench 的研究揭示了大型语言模型在科学领域的潜在风险，尤其是其可能助长伪科学的能力。随着这些技术的发展，确保其科学性和准确性显得尤为重要，必须在实际应用前加强对其内容的审查与把控。