推荐系统不再瞎猜!IEDR首创多情境对比解耦学习,精准拆解用户偏好动因

在推荐系统中,用户的行为(如购买、点击)在不同的 context 环境(如时间和位置)下可能有很大的差异。这是因为用户行为由两类因素共同决定:内在因素(intrinsic factors),反映用户一致的偏好,以及外在因素(extrinsic factors),反映可能在不同 context 中变化的外部激励。


区分内在和外在因素有助于更好地学习用户行为模式。然而,现有研究仅考虑从单一的 context(如仅时间或者仅位置)中区分这些因素,并且从设计上也是专门针对这一种 context(如针对时间 context 的长短期记忆设计),忽略了用户的外在因素可能同时受到各种上下文交互影响的事实。

由华中科技大学‘智能信息与大数据实验室’(http://intrebid.cs.hust.edu.cn/),阿里巴巴达摩院以及墨尔本大学共同发表在 Transactions of Information Systems(TOIS)的工作提出了内在-外在因素解耦推荐(Intrinsic-Extrinsic Disentangled Recommendation,IEDR)模型。


IEDR 是一个通用框架,能够同时考虑多种 context 环境的复杂相互作用,将内在因素与外在因素进行有效区分,从而实现更准确的因素学习,进而提高推荐准确性。


上图展示了一个具体示例,比较了现有工作(仅考虑单一社交环境 context)和文章的方法(考虑多种 context)在学习内在和外在因素方面的差异。


如图所示,Bob 通常偏好健康食品,但在与朋友聚会时可能会选择多样化的食品。在数据集中,观察到 Bob 在寒冷天气下的行为。现有模型仅从社交设置(独处或与朋友在一起)识别因素,可能错误地将温食偏好识别为 Bob 的内在因素。


相比之下,IEDR 同时考虑社交和天气两种 context(根据已有信息模型可以考虑任意数量与种类 context),能够正确捕捉 Bob 的真正内在偏好(健康食品)和外在因素(在寒冷天气下偏好温食;与朋友在一起时偏好多样化食品),从而在热天气场景(全新的 context 组合)下提供更合适的推荐。

论文标题:

Intrinsic and Extrinsic Factor Disentanglement for Recommendation in Various Context Scenarios

论文链接:

https://dl.acm.org/doi/pdf/10.1145/3722553

代码链接:

https://github.com/ethanmock/IEDR



模型介绍

为解决多情境下用户行为驱动因素难以区分的问题,IEDR 模型采用“特征图建模 + 解耦学习”融合模块架构:推荐预测模块通过特征图网络构建用户、物品与上下文间的交互关系,实现基础表示学习。


而创新性的解耦模块结合上下文不变对比学习与双向互信息最小化机制,首次在无先验假设(无需考虑 context 类型)下精确区分稳定的内在偏好与随情境变化的外在动机,显著提升推荐准确性与可解释性。


IEDR 模型主要由两个模块组成:


1. 推荐预测(RP)模块:该模块基于当前 SOTA 特征图网络架构 SIGN 建模用户、物品与上下文之间的特征交互关系,从而生成语义丰富的联合表示。


在此基础上,模型进一步构造内在与外在因素的初始表示,为后续的解耦学习提供基础输入,同时实现行为概率的联合预测。


2. 对比内在-外在解耦(CIED)模块:该模块融合上下文不变的对比学习机制与双向互信息最小化策略,首次在多情境交互下实现了无监督的因素解耦。


通过对同一用户在不同上下文中的行为表示进行对比,提取稳定的内在偏好;同时引入对称性互信息约束,有效剥离因情境变化引发的外在动机,从而实现可控、清晰的偏好建模。


总体结构如下图所示:

基于对比学习的内在-外在解耦(CIED)模块由两个相互关联的组件组成:


1. 上下文不变对比学习组件(Contrastive Learning Component):该组件通过对比不同上下文下的用户表示来学习内在表示,目标是最大化同一用户在不同上下文下的内在表示对(正样本对)之间的一致性,同时最小化在相同上下文下不同用户生成的内在表示(负样本对)之间的一致性。


这种对比目标鼓励模型捕获跨上下文共享的信息作为内在表示。


2. 解耦组件(Disentanglement Component):为了同时捕获内在和外在因素,需要将外在因素与内在因素解耦。文章提出了一种双向互信息最小化方法 BiDis,在两个方向上同时最小化内在和外在因素之间的互信息,实现更稳健和有效的解耦。


这两个组件协同工作,使 IEDR 能够有效地学习有意义的内在和外在因素,从而在各种上下文场景中捕获复杂的用户行为模式。CIED 模块先通过上下文不变对比学习学习上下文不变的内在因素,然后通过解耦组件进一步将这些因素与外在因素分离。



实验结果

文章在四个真实数据集上进行了广泛的实验:Frappe(移动应用推荐)、Yelp(餐厅推荐)以及两个 Amazon 数据集(Movies 和 CDs)。实验结果表明:


1. IEDR 在各种上下文场景中显著优于最先进的方法,在 NDCG 指标上提高了最多 4%。

2. 可视化分析展示了 IEDR 成功解耦内在和外在因素的能力,验证了文章的方法能够学习到有意义的解耦表示。



3. 案例研究来分析发现 IEDR 学习到了的内在和外在因素之间的差异。案例中,一个用户在不同 context(周末与工作日)下的内在和外在评分分布发现,该用户的内在因素(Intrinsic)评分在周末和工作日保持高度一致,表明 IEDR 成功捕获了用户稳定的偏好。


而外在因素(Extrinsic)评分则在两种上下文下呈现明显差异,从高分到低分的显著波动反映了用户偏好受上下文影响的变化特性。



总结

本文提出的 IEDR 模型首次提出了一个通用框架,能够在多种 context 的复杂交互条件下实现对用户内在偏好与外在动机的显式建模与精细解耦,显著提升了推荐系统的准确性与解释能力。


相比现有方法,IEDR 不仅在多个真实数据集上取得领先性能,更揭示了用户行为如何随情境变化而迁移的深层机制。该方法为理解复杂用户决策模式打开了新方向,未来可进一步扩展至更细粒度因素建模及多模态推荐等更广泛应用场景。


(文:PaperWeekly)

发表评论