前言
本次依旧分享一篇序列推荐论文,文章最吸引我的地方就是采用度量学习来对用户的长期偏好进行建模。
本文约1.7k字,预计阅读10分钟。
概要
“Next Item Recommendation with Self0Attentive Metric Learning”是2019年发表在AAAI上的论文。文章提出了一个AttRec模型(召回):利用自注意力机制来捕捉用户历史行为交互的物品与物品之间的关系,从而更好的学习用户短期兴趣的表示;利用度量学习来建模用户的长期偏好,即同时考虑了“局部”与“全局”。
其实基于Attention的推荐模型特别多,例如DIN、STAMP、SASRec、BST等,基本都是大同小异。关于文章中提到的短期兴趣与长期兴趣,在STAMP中也提到了,不过两者对于短期、长期兴趣建模的方式不同。本文最吸引我的是Metric Learning
,采用「度量学习」来建模用户的长期兴趣(STAMP采用的是衡量历史物品序列与最后一个物品相关性的注意力模型)。
「关键词:」 度量学习、自注意力
模型结构:AttRec
模型总体结构如下图所示:

AttRec主要是由两部分组成:
通过自注意力机制(self-attention)来建模用户短期意图;
通过协同度量学习(collaborative metric learning)来建模用户长期偏好;
问题描述
定义用户集 和物品集 ,且 。 来比表示用户之前交互过的物品序列, 。模型的「目标」是通过用户历史行为来预测下一个用户可能交互的物品。
短期兴趣建模
与基础的注意力模型在有限的背景知识下学习表示不同,自我注意可以保持上下文的序列信息,并捕捉序列中元素之间的关系,而不管它们之间的距离。下图是文章中的自注意力模块。

该部分是为了建立短期兴趣,因此,作者假设用户的短期意图来自于最近 个交互。令