基于BS架构的图书检索推荐系统文献综述

 2023-08-28 09:08
  1. 选题背景和意义:
  2. 选题背景

本课题来源于上海阅文集团的一个网上购书系统的简化版,更注重在推荐算法的实现,主要用来精确提供给用户需要的书籍,并基于一定的数据推荐给用户其他所需书籍。其中,前端的开发与设计模块和后端接口设计,是本人主要参与的工作。

面对目前书籍推送结果不够精确的问题,一般是因为数据量不够,导致模型精确度不够,推送给用户的结果不够精确。但是上海阅文集团作为专注文化领域尤其是图书领域的龙头企业,图书数据非常丰富,旗下更有起点阅读中文网这样的国内知名网站,并有着数以众多的用户群体,数据问题可以说迎刃而解。并采用当下流行的协同过滤推荐算法使得推荐结果精确度极大提升。

  1. 意义

以本课题作为毕业设计一方面可以完善敏捷开发的流程,使之作为以后开发的标准;另一方面可以加深对协同过滤算法,flask框架,tensorflow框架,pandas和python技术的理解。功能上,我们能够推送给用户更为准确的推荐书籍结果。

  1. 课题关键问题及难点:
  2. 如何实现持续集成持续部署。

实现持续集成和持续部署是为了给开发人员提供一个效率更高的开发环境。因为要频繁的版本更迭和整体系统的集成。在这样的开发环境下,快速集成快速部署就显得尤为重要。我们将采用svn来完成项目的源代码管理、并于其他开发人员之间的交流。进而为以后的开发积累经验,形成一套成熟的敏捷开发的流程。

  1. 处理数据

虽然基于上海阅文平台我们有着众多的数据,但由于源数据通常包含一些空值甚至空列,会影响数据分析的时间和效率,在预览了数据摘要后,需要对这些无效数据进行处理。我们采用了python pandas来进行处理这庞大的数据。

  1. 协同过滤算法

公司采用的是基于用户的协同过滤推荐算法,但算法存在一定的局限性,例如一段时间内非常流行的某种商品,或者某种通用的商品,购买的人非常多,此时如果列入正常计算过程中就没有太大意义了,并且会增加负担。那只能给此种商品价一个权值或者在数据预处理阶段作为脏数据处理掉。增加了项目开发的负担。

  1. 文献综述(或调研报告):
  2. 协同过滤

推荐系统已经被广泛应用在许多领域,例如图书,音乐和电影推荐。近些年来,随着信息技术的快速发展,在许多数字图书馆图书的数量正在快速增长。在某种程度上,推荐系统可以帮助读者找到相关图书。

最近,一些学者在推荐系统上已经取得很大的进步。Lu等人提出了基于内容过滤和协同过滤算法。协同过滤推荐算法可以被划分成两种类型:基于内容和基于模型。一些学者也把他们划分为基于邻居和基于模型。尽管他们的名字不同,分类算法的核心内容的描述是相似的。Antonio Hernando等人为基于贝叶斯概率模型的用户评级提出了一个协同过滤推荐的预测方法。Park等人提出了使用K近邻替代K相似邻的快速协同过滤算法。Kouki等人设计了一个通过合并不同的信息信号自动学习和预测的混合概率可扩展的混合推荐方法。

基于内存的协同过滤算法根据存在的数据集计算用户和商品之间的相似性并且挑选作为目标用户的邻居包含高相似性的的用户和商品。然后计算邻居的评分用来预测目标用户对一特殊商品的偏好程度。这种类型的预测系统在偏好程度的基础上提供一个推荐。

基于模型的协同过滤算法通过学习训练数据集来设计出一个模型,病使用模型来预测未知数据。典型的基于模型的协同过滤包括基于聚类技术的协同过滤,基于概率方法的协同过滤,基于矩阵分解协同过滤等。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。

已经是最后一篇了