NeFut Logo NeFut
EN 管理员登录

[AI学术] AIChilles:自动揭示AI进化系统中的隐藏弱点

发布于:2026-06-17 22:00
#algorithm #AI #Open Source

随着计算机系统社区对AI驱动的系统进化的兴趣日益增长,AI代理逐步重写系统的框架如AdaEvolve和Engram报告了相较于人类设计算法12-60%的分数提升。尽管这些结果令人鼓舞,但在未知工作负载下,AI进化程序的表现可能更差,并且可能出现可扩展性回归的问题。因此,我们迫切需要自动化机制来揭示AI进化系统程序中的隐藏弱点。

为此,我们开发了AIChilles,输入基线程序 $P$ 和AI进化程序 $P'$,AIChilles会搜索有效工作负载,以评估 $P'$ 在正确性、运行时间、内存使用或输出质量上相较于 $P$ 的回归表现。为应对系统应用的多样性、弱点类型和潜在错误,AIChilles结合了确定性工作负载参数提取、基于代理的约束推断、差分oracle和代码频率覆盖,以发现多样化的失败案例。

在五个系统应用和30个AI进化程序中,AIChilles发现了49个不同的隐藏弱点。我们还展示了在AI驱动的开发生命周期中显式包含AIChilles可以减轻这些弱点的影响。

博主点评: AIChilles的提出为AI驱动的系统进化提供了重要的安全保障,通过主动识别潜在的弱点,可以显著提升AI程序的鲁棒性与可靠性。这一研究成果将对未来的AI系统开发产生深远影响。

原文链接: https://arxiv.org/abs/2606.15834

[h] 返回首页