[AI学术] 最小监督：面向委托AI系统的不确定性治理

摘要

随着AI系统越来越多地将决策委托给专业模型、评估者、工具和监督控制器，核心问题已不再仅仅是模型的准确性，而是如何进行不确定性意识的治理：应授予多大自主权、哪些证据应校准信任、委托AI系统能维持的性能上限以及何时需要人类干预。

我们提出了最小充分监督原则（MSO），这是一个关于自主委托的变分原则：在满足交付约束的情况下，最小化在Fisher信息流形上的治理负担。由此得到的Euler-Lagrange解法产生了在任务空间中治理委托的水填充分配。

基于揭示行为的治理委托通道模型，我们证明了静态符号逐一审查政策的容量定理，推导出与工作流复杂性相关的质量降级的局部一阶近似，并给出了一种主导漂移的自主时间缩放定律，将干预时机与有效容量、复杂性和漂移联系起来。

在此框架内，掩蔽被视为一种结构性AI治理病理：纠正的性能可能掩盖校准信任所需的能力信号。合成模拟和半真实重建的工作流支持设计建议，包括上游优先纠正、基于敏感度的干预，以及在扩展自主权之前进行明确的可行性检查。结果是一个可计算的框架，用于处理委托AI系统中的不确定性、规划和监督。

一个相关的Python包可以在 GitHub 上找到。

博主点评： 本文通过提出最小充分监督原则，深入探讨了AI系统决策自治与人类干预之间的平衡，为不确定性治理提供了新的视角。其理论框架和实用建议将对未来的AI治理实践产生重要影响。