摘要
顺序或时间戳的交互日志提供了数字应用使用的客观记录,但其粒度和噪声常常掩盖了人们工作中的有意义的见解。这些见解对于基于真实用户交互改进数字产品至关重要。以往的研究利用深度学习模型将用户行为聚类为高层次活动,但这些方法对噪声极为敏感,且难以在不同应用之间进行泛化。
为了解决这一局限性,我们提出了WorkflowView框架,该框架使用大型语言模型(LLMs)将低层次的行为序列抽象为高层次活动。我们在三个不同的、具有挑战性的序列任务和多样化领域中验证了我们方法的有效性和普适性:
- 从浏览器日志中进行零样本任务描述重建(实现高语义相似度,$r_{sim} = 0.91$);
- 使用MOOC交互日志进行少样本学生辍学预测(仅用五个少样本示例达到加权$F_1 = 0.90$);
- 对Microsoft Word文档工作流中AI工具集成的匿名、隐私保护分析。
我们的工作表明,基于LLM的抽象是将低层次行为数据转化为高层次、可解释且可操作见解的有效途径。我们还讨论了在日志基础设施中部署LLM推理的实际考虑,包括计算效率和用户隐私。
博主点评: 本文通过WorkflowView框架展示了如何有效地将低层次的用户行为转化为高层次的可解释活动,强调了LLM在处理噪声数据时的优势。这一创新方法为数字产品的改进提供了新的视角,具有广泛的应用潜力。