扩展多智能体世界的AI安全研究
过去十年,我们专注于提升单个AI模型的能力与安全性。今天,Google DeepMind与Schmidt Sciences、Cooperative AI Foundation、ARIA及Google.org共同宣布,全球研究人员可申请高达1000万美元的技术研究资金。
随着AI技术的扩展,我们正进入一个新纪元。未来,数百万个由不同组织构建的AI智能体将在数字环境中相互作用、沟通、协商与交易。在这些系统相互作用时,必须保证其安全与可预测性。这一转变为我们提供了重要的机会:从一开始就加强整个AI生态系统的安全与稳定。
这次资金申请的重点是研究大规模多智能体AI系统作为一个群体的行为,以及如何提供框架以理解和减轻潜在风险。我们希望通过全球研究人员的力量,解决独立系统在不同网络中相互作用时产生的“隐形”安全风险。
智能体生态系统的重要性
当大量AI智能体相互作用时,可能会突然出现新的集体行为和能力。目前,我们缺乏预测、测量和监控这些转变的工具。大多数安全评估都是在孤立的模型中进行。然而,正如我们和其他人之前所论证的,互动的自主智能体可能会产生复杂的“涌现”行为,这些行为难以预见。理解如何管理这些系统级行为是我们的核心目标。
扩展多智能体安全研究的前沿
尽管多智能体安全的基础框架已存在,但这些系统的快速演变需要立即、大规模的研究扩展。我们的2025年研究建立了理解这些互动的框架,而我们最近对AI智能体陷阱的研究则探讨了智能体在对抗环境中面临的脆弱性。现在,我们必须加快步伐。我们处于一个关键时刻,多智能体互动的复杂性正在超越现有的安全模型。这次资金申请旨在通过支持全球独立研究人员的网络来加速进展。
行动的协作呼吁
没有任何实验室可以单独解决多智能体安全问题。我们邀请学术界和独立研究人员在以下四个优先领域提交提案:
- 沙盒与测试平台:建立现实、可重复的环境,以评估、比较和加速多智能体安全各个领域的进展。
- 智能体网络的科学:理解相互作用的智能体群体的安全相关特性,包括研究如何出现和扩展集体能力。
- 加强智能体基础设施:压力测试身份、声誉和承诺的协议,以确保跨平台智能体交互的安全性。
- 监督与控制:开发监控已部署智能体群体并减轻集体伤害的方法。
我们邀请研究人员审查我们的提案请求,加入我们共同构建多智能体未来的安全基础。申请截止日期为2026年8月8日,获奖者预计将在2026年秋季公布。有关技术要求和申请流程的更多详细信息,请访问我们的申请门户。
博主点评: 随着AI的快速发展,多智能体系统的安全性成为亟待解决的重要课题。此次资助呼吁不仅为研究人员提供了资金支持,也为多方合作搭建了桥梁,期望能有效应对未来潜在的安全风险。多智能体的互动行为复杂且难以预测,急需构建新的框架以保障安全。