[AI学术] 揭秘互动定向广告中的属性推断技术

摘要

定向广告系统能够将广告主选择的受众与展示用户可见行为的广告单元配对。当一次互动与引发该互动的广告活动保持关联时，广告主可能会获得与用户相关的观察结果，而不仅仅是汇总报告。我们将这一渠道建模为一个噪声预言机，用于属性推断。该模型将定向谓词、曝光、互动和披露进行分离。这些边界捕捉了资格与交付之间的差距，以及互动与广告商可见性之间的差距。

我们使用经过公共数据校准的合成人口建立了可重复的基准，每个基准都有已知的敏感标签。生成的活动语义层提供了主题变体和响应先验。模拟器生成了真实数据、事件轨迹、披露观察和指标。评估比较了贝叶斯、监督、正负样本和自适应攻击，基于常见的活动和披露定义。最终评估使用了四个主题变体、七个模拟器种子和两种互动设置。具有身份曝光的重复活动产生了可测量但受限的推断信号。在160次活动中，贝叶斯和监督攻击在主要设置中达到了约0.64的AUC，而在更高互动设置中达到了约0.65的AUC。披露政策是最强的控制手段。汇总报告移除了与用户相关的评估预言机输入。类型过滤和随机披露减少了发布的信号。最终结果是一个模型、工件和隐私防护评估方法，适用于互动定向广告。代码可在 GitHub 上获取。

博主点评： 本文通过建立噪声预言机模型，为定向广告中的用户属性推断提供了新视角，强调了隐私保护的重要性。采用的评估方法和模拟器设计展示了如何更好地理解和控制广告效果，有助于广告商在确保用户隐私的同时优化投放策略。