基于影评信息挖掘的情感分析文献综述

 2022-03-12 15:29:25

文献综述

文本情感分析(Sentiment Analysis)是指利用自然语言处理和文本挖掘技术,对带有情感色彩的主观性文本进行分析、处理和抽取的过程。文本情感分析包括从原始文本爬取,文本预处理,语料库和情感词库构建以及情感分析结果等全流程。[1]

情感分类又称情感倾向性分析,是指对给定的文本,识别其中主观性文本的倾向是肯定还是否定的,或者说是正面还是负面的,是情感分析领域研究最多的。目前对于情感分类的方法主要有3种:基于情感词标注、基于传统机器学习、基于深度学习。

1 基于情感词标注[2]

基于情感词标注的方法将表示情感的词语分为正面情感词和负面情感词, 构造了一个情感词典, 并通过计算一个句子中正负情感词的相对数量来决定句子的情感倾向。目前使用较多的情感词典主要有两种:一种是BosonNLP情感词典,另一种是知网推出的情感词典。而目前的研究主要是将情感词典作为辅助应用到CNN模型中。基于情感词典的文本情感分类是容易实现的,其核心在于情感词典 (类似于大脑语料库) 的训练。但是该方法对词典的构建要求很高, 且随着新的词汇不断产生,需要不断更新词典,词典构建和判断规则质量两者都需要耗费很多人力,包括人工设计和人们的先验知识,因此这种方法不具有广泛性。

2 基于传统机器学习[2]

Pang等[4]于2002年初次提出使用标准的机器学习方法解决情感分类问题。基于机器学习技术的情感分类研究工作主要需要进行模型的训练。情感分类中常用的特征有N-gram特征、句法特征等。这类方法仍然依赖于人工设计,研究过程中也容易受到人为因素影响。而且人工设计的特征具有领域限制性,在某一领域的特征集不一定适应另一个领域。此外,基于机器学习的情感分类方法多使用经典分类模型如支持向量机、朴素贝叶斯、最大熵模型等,其中多数模型的性能依赖于标注数据集的质量,这些高质量的数据集也需要投入大量人工成本。[5]

  1. 基于深度学习[2][3]

深度学习是基于特征自学习和深度神经网络(DNN)的一系列机器学习算法的总称。基于深度学习模型的情感分类主要分为两个步骤:(1)将需要分类的评论语料表达称为语义词向量;(2)通过不同的语义合成方法用词向量得到所对应句子或文档的特征表达式, 最后通过深度神经网络进行分类。

几种基本的深度学习模型[6]:

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。