摘要
随着AI系统越来越多地将决策委托给专业模型、评估者、工具和监督控制器,核心问题已不再仅仅是模型的准确性,而是如何进行不确定性意识的治理:应授予多大自主权、哪些证据应校准信任、委托AI系统能维持的性能上限以及何时需要人类干预。
我们提出了最小充分监督原则(MSO),这是一个关于自主委托的变分原则:在满足交付约束的情况下,最小化在Fisher信息流形上的治理负担。由此得到的Euler-Lagrange解法产生了在任务空间中治理委托的水填充分配。
基于揭示行为的治理委托通道模型,我们证明了静态符号逐一审查政策的容量定理,推导出与工作流复杂性相关的质量降级的局部一阶近似,并给出了一种主导漂移的自主时间缩放定律,将干预时机与有效容量、复杂性和漂移联系起来。
在此框架内,掩蔽被视为一种结构性AI治理病理:纠正的性能可能掩盖校准信任所需的能力信号。合成模拟和半真实重建的工作流支持设计建议,包括上游优先纠正、基于敏感度的干预,以及在扩展自主权之前进行明确的可行性检查。结果是一个可计算的框架,用于处理委托AI系统中的不确定性、规划和监督。
一个相关的Python包可以在 GitHub 上找到。
博主点评: 本文通过提出最小充分监督原则,深入探讨了AI系统决策自治与人类干预之间的平衡,为不确定性治理提供了新的视角。其理论框架和实用建议将对未来的AI治理实践产生重要影响。