[AI学术] 革命性水印技术：LineageMark 追踪模型衍生链中的贡献

在开放的大型语言模型(LLM)生态系统中，模型通常会在多个领域和应用中适应，形成多阶段的衍生链。因此，追踪和验证历史贡献对模型的来源和知识产权保护至关重要。现有的水印技术主要针对单用户、一次性嵌入，通常在重复模型衍生和增量更新中失效。

为了解决这个问题，我们提出了 LineageMark，这是一种用于模型衍生链的多用户白盒水印框架。该框架通过基于投影的方法将水印编码到模型参数中。首先选择稳定的载体以减少对模型变化的敏感性，每个水印位通过这些载体的投影统计来表示。额外的水印插入仅在投影空间中引入有限的扰动，并使用边际约束来保持信号的完整性。

我们评估了 LineageMark 在多阶段模型衍生链中的有效性。实验结果表明，LineageMark 能够在多阶段衍生中保留贡献者水印，并支持增量多用户水印插入。此外，它对诸如重新水印、微调、量化和剪枝等扰动表现出良好的鲁棒性。

博主点评： LineageMark 的出现为模型衍生链中的贡献追踪提供了创新解决方案，尤其是在多用户环境下的应用潜力巨大。其采用的投影方法有效降低了对模型变化的敏感性，确保了水印的持久性和可靠性，值得关注其在实际应用中的表现。