在测试临床应用的 LLM 时,模拟真实的患者互动是一个关键需求,能够避免耗时且成本高昂的用户研究。然而,现有方法通常缺乏真实性和可控性,常常在未被要求的情况下过度分享信息,并未能捕捉到患者行为的广泛变异性。
我们提出了 PatientsWithPersonality (PWP),一个患者模拟框架,通过对潜在患者状态进行明确的个性参数化,生成真实且多样化的虚拟患者响应。
我们的框架基于 HEXACO,一个用于量化和参数化人类行为特征的六维个性空间,使得在一个统一框架内能够对对话风格、合作性和信息披露进行细粒度的控制。
在临床评估中,PWP 被评估为几乎与真实人类演员一样真实,并且明显优于先前的模拟器,同时被标记为“过于信息丰富”的频率显著降低。
通过在 HEXACO 轴上进行条件化,我们能够生成其配置特征可由临床医生和自动评分系统恢复的个性,展现出比最接近的基线更广泛的行为特征,并防止信息过度共享。
总而言之,我们的框架为通过具有真实感和可操控性的患者模拟器进行更准确的信息 LLM 基准测试铺平了道路。
博主点评: PWP 框架在个性化患者模拟方面的创新,为临床应用测试提供了新的思路。通过 HEXACO 个性参数化,能够实现更高的交互真实性和控制力,极大地提升了 LLM 的评估标准,对医疗领域的技术应用具有重要意义。