本论文发表于ACM MM2021,针对推荐系统的冷启动问题进行了研究。论文设计了基于图结构的user-item的相关性框架得到user embedding和item embeding,但是对于冷启动item则无能为力,为此又设计了基于内容的item表征和基于图结构的item表征的对比学习任务。其实这个思维框架和Google的《Self-supervised Learning for Large-scale Item Recommendations》很像,也是解决长尾冷启动问题的。

具体来说,论文提出了基于对比学习的冷启动推荐框架CLCRec,其由三部分组成:Contrastive Pair Organization,Contrastive Embedding Network和Contrasitve Optimization modules。

论文的一个亮点在于从理论的角度推导了对比学习任务的目标函数,这里就不做过多介绍了,详细可以读原文,接下来介绍下CLCRec是什么,以及两个对比学习任务分别是如何设计的。

1. CLCRec是什么

CLCRec其实就是把基于图结构的user-item的相关性框架和item对比学习的任务进行融合,其融合公式如下:

上式第一部分是item的对比学习任务,第二部分是基于图结构的user-item的相关性框架。第三部分是假设所有参数服从高斯先验分布。

2. user-item的相关性框架

2.1 样本设计

$\lbrace (u,i), (u,j_1),(u,j_2)..,(u,j_K) \rbrace$

(u,i)是正样本,u表示用户,i表示用户交互过的item;$(u,j_K)$是负样本,$j_K$表示用户u没有交互过的item,K是随机采样的item个数。

2.2 相关性设计

简单来说就是,用户交互过的item集合来表征user,购买过item的用户集合来表征item,最后计算二者的相关性。这样的话对于冷启动的item则无能为力,所以又设计了item的对比学习任务。

3 item对比学习任务

3.1 样本设计

$\lbrace (i,i), (i,j_1),(i,j_2)..,(i,j_K) \rbrace$

$(i,i)$ 是正样本,$(i,j_K)$是负样本。$i$和$j_K$都是item。

3.2 对比学习设计

item的对比学习任务做了两个数据增强。1是基于user-item的相关性框架得到的item表征,2是基于item的内容信息通过一个特征提取器得到的item表征,特征提取器是一个简单的MLP。

在得到上述两个item表征之后,最后计算二者的相似性。

4. 目标函数

更详细的目标函数如下:

5. 实验对比