基于点击反馈的成对推荐模型优化文献综述

 2021-12-28 23:00:18

全文总字数:5158字

文献综述

  1. 个性化推荐系统的概念

随着互联网的普及和发展,给用户带来了海量的信息,而这些信息中存在大量的冗余部分,使得用户往往很难获取到自己真正需要的那部分信息,对信息的使用效率效率反而降低了,这就是互联网时代的信息超载(information overload)[1]。个性化推荐系统(Personalized Recommender Systems)是为了解决信息超载问题的主要解决方法。它是根据用户的信息需求、兴趣等,将用户感兴趣的信息、物品等推荐给用户的个性化信息推荐系统。与其他的推荐系统相比,此推荐系统主要是通过对用户的兴趣偏好进行研究,排序、计算不同信息等需求在用户的重要程度,从而向用户推荐出比重较高的信息。它是从用户自身的角度出发,来为用户推荐感兴趣的内容。一个完善的推荐系统不仅仅能为不同的用户提供差别的个性化服务,还能使得用户对推荐系统产生依赖关系,从而不断地向用户提供更加贴合真实需求的服务。

个性化推荐系统具有良好的发展和应用场景,其中它与电子商务领域的契合度最高。目前,几乎所有的大型电子商务系统,如国外的Amazon、eBay、国内的淘宝、京东等电子商务网站都在不同程度上使用了各种形式的个性化推荐系统。因此,如何提高个性化推荐系统的能力,有效地吸引新的用户以及保留平台存在的用户,提升电子商务系统的整体服务能力,占据更大的市场份额成了研究的一大热门。

  1. 隐式反馈的概念

在推荐系统中,显式反馈更多地被用作反应用户真实偏好的标准(Truth Ground)[2],它们不仅表示了用户对于产品的喜好,更加细化了用户对产品的喜好程度和喜好相关的因素,信息相对更加完善和丰富。显式反馈是一种直观的评分数值。例如,京东商城和豆瓣电影都是用评分的反馈来获取用户的反馈信息。此外,标签数据也是一种显式反馈,例如网易云音乐就是在用户对某一歌曲进行“喜爱”操作时,在用户的数据中添加了歌曲的相应标签。这一类型的反馈能够深入地反应用户的偏好。但是,显式反馈同时也受其他因素的影响:一方面,用户可能对涉及自己隐私的反馈内容不进行反馈,这会在一定程度上造成某些反馈的缺失;另一方面,产品的反馈可能是因为人为刻意的操作因素而不同,这会造成反馈的数据在一定程度上与真实的情况并不相符的现象。

相对于显式反馈,隐式反馈在一定程度上能够缓解上述存在的问题。显式反馈是需要用户在浏览或使用产品之后对其作出相应的评价,可能会因此造成一定反馈的缺失。而后者在个性化推荐系统中大量的存在,它是根据用户的相关操作自动记录下来的反馈,相对来说更加容易获取。一般来说,隐式反馈是连续不断产生的,无需用户提供,这也就不会造成反馈的缺失这种情况。但对于隐式反馈也存在着某些问题:

(1)不平衡类标问题(Unbalanced Class Problem)[3],其核心问题在于,由于数据的高度集中,缺少与之对应的负反馈样本,从而导致难以对推荐系统进行训练。推荐系统只能获取到用户的正反馈信息,例如用户购买了某件商品,由此可以推测出用户喜欢某一类的商品,但无法得出用户是否喜欢某物品的结论。所以对于缺失的负反馈信息的处理是隐式反馈推荐方法首要解决的重点问题;

(2)数据噪音问题,仅仅依靠用户的某种行为来对用户的偏好进行推测是十分的困难的。隐式反馈并不是用户的主观反馈,其反馈的可信度较低,相较于显式反馈缺少一定的规律性,更难进行处理;

(3)偏好表达与可信度问题,显式评分能够直接表达出用户的喜好程度能力,而隐式反馈中的数值更多是包含用户行为的频率,如播放的次数、点击率、点击操作等信息,更高的数值并不一定能够表示出用户对该物品的喜好程度更高。但从另一个方面来说,它的偏好表达具有更高的可信度,相对于一次性的事件,高频率的事件能够更好地反映出用户的真实偏好。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。