个性化电影推荐系统的设计和实现文献综述

 2022-03-22 20:47:19

个性化电影推荐系统

一、引言

21世纪是网络的世界,是信息数据流的世界。从1969年互联网诞生至今,网络已经与火能、电能一样,渗透人们的生活,已成为人们生活中不可或缺的一部分。目前,随着网络的发展,信息生产成为产业链,而被生产的信息经过不断积累与扩大生产,继而出现“信息过载”的问题。“信息过载”问题已经影响了人们的日常生活。网络电影作为人们日常娱乐的一个主要方式,同样不可避免地受到“信息过载”的冲击。与之而来的是人们缺乏对自身观看需求的准确定位,造成了巨量影片资源与用户个性化需求之间的矛盾日益凸显。因此,为了保证人们能够尽快找到自身兴趣相似的影片,以及电影生产者生产的影片可以准确投放,实现影片生产的价值,个性化电影推荐系统应运而生。

二、常用的个性化电影推荐系统

Spark平台下电影推荐系统的设计【1】【2】【3】

传统基于Hadoop或单机下基于Mahout构建的电影推荐系统面对数据量不断增大以及推荐算法模型需要大量迭代的情况时,会出现推荐效果差、运行速度明显下降、无法实时为用户进行个性化推荐的情况。针对以上问题,以电影评分数据集为背景,使用Hadoop、Spark、Kafka、Hive等大数据处理技术进行系统架构搭建,并采用改进后的余弦相似性的协同过滤和基于用户喜爱物品的物品协同过滤算法对MLlib协同过滤算法模型进行改进,对离线数据以及实时数据进行计算,产生TOP-N推荐结果,实现Spark平台下电影推荐系统。实验结果表明,在Spark平台下,该系统相较传统方法不仅数据处理速度和推荐准确性显著提升,而且稳定性更强。

2.基于深度学习的电影个性化推荐算法研究【4】

随着用户及电影项目数量的急剧增加,数据稀疏性问题成为了传统协同过滤算法面临的一大挑战,严重影响了推荐质量,导致用户体验度较差。传统的协同过滤算法无法有效提取数据中的非线性因素,且考虑的数据角度单一,这也使得算法性能受限。随着深度学习技术的蓬勃发展,将传统推荐算法与深度学习技术相融合解决上述问题成为了新的发展趋势。针对以上问题考虑将改进加权Slope One方法与深度学习中的自编码器相结合,在缓解数据稀疏性问题的同时,学习数据集的更深层特征,进而提高推荐质量。具体研究内容有1.针对数据稀疏所导致的近邻评分数据过少的问题,提出一种基于改进加权Slope One的评分矩阵填充方法。该方法利用改进的Slope One算法对未评分项目进行预测,然后将评分预测值填充到原始矩阵中,得到新的用户-项目评分矩阵,从而使得数据稀疏性大大降低。同时,本方法也为之后的DeepRec算法缓解数据稀疏性问题提供了思路。2.由于经典的协同过滤方法采用浅层模型无法学习到用户和项目的深层次非线性特征,进而导致推荐质量较差。针对上述问题,在前一个工作的基础上,将深度学习模型中的自编码器引入到电影推荐的评分预测任务中来,提出一种基于深度降噪自编码器的电影个性化推荐算法,命名为DeepRec。该算法利用深度自编码器学习非线性和有意义的用户-项目关系;同时,由于自编码器具有去噪的特性,故加入合适的噪声,以提高预测的鲁棒性和准确度。

3.基于混合算法的电影推荐系统的研究与设计【5】

为了充分利用传统GAN模型生成向量的对抗训练优势,将协同过滤算法(CF)用在GAN模型中,采用基于GAN模型的协同过滤算法——CFGAN模型,向用户提供其可能感兴趣的top-N推荐。同时为了满足用户对多样性的需求,提高推荐系统的惊喜度,又在CFGAN模型的基础上,结合DPP模型,采用成对训练的对抗方式,实现融合多样性与相关性的改进的CFGAN模型,改进后的CFGAN模型在不损失相关性的情况下可以为用户提供多样性的推荐列表,设计出一个既满足系统准确性又满足多样性的电影推荐系统。以MovieLens 100K电影数据集为基础数据集,对CFGAN方法进行研究并与传统推荐算法进行比较实验,然后对与DPP模型相结合的CFGAN方法进行研究与实验,研究与讨论了与传统推荐算法相比,融合多样性与相关性的CFGAN模型进行推荐的有效性,其提升了推荐算法的多样性与用户惊喜度;同时还对在线用户的行为数据进行计算,并将其作为评分数据集,来训练改进后的CFGAN模型,从而实现基于混合算法的电影推荐系统。与传统的电影推荐系统相比,基于混合算法的电影推荐系统提升了系统的实时准确性、稳定性与高效性,推荐结果更加多样化,改善了用户体验。

4.基于粒计算的电影推荐系统设计【6】

基于粒计算的电影推荐系统选取了电影推荐的场景,借助粒计算模拟人脑处理复杂问题的方式,将其应用到推荐系统的核心——推荐算法中。分析常见推荐算法的流程,总结了常规相似度计算的优缺点,并根据用户评分习惯的不同,利用粒计算中粗细粒子聚合分解的研究方法,对用户群体进行分类。利用粒度分析的求解思想,提出了分层粒化聚类算法。算法分成离线和在线两部分:离线部分根据U-I评分矩阵对所有用户分层粒化,直到生成最终的推荐聚类,在线部分利用生成的聚类进行推荐。利用Django这一轻量级开发框架,实现了基于粒计算的电影推荐系统。数据存储使用My SQL,用户可以通过Web浏览器实现观看电影、查看推荐等人机交互操作。设计管理员模式,管理员可在后台增删电影,查看用户信息。针对系统各模块设计了测试用例并进行了功能测试。在与传统协同过滤算法进行对比后表明,推荐精度提高了2.90%、线上平均每个用户的推荐时间降低了5.04%。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。