基于情感分析的B站动漫影评数据分析文献综述

 2022-03-16 22:52:34

1.文本情感分析的定义

理解一个陌生的词汇的最好方法就是百度百科[1]。通过通读百度百科有关文本情感分析的全部内容,我对文本情感技术有了初步的理解。

从定义上来说,文本情感分析(Text sentiment analysis)技术是一种数据分析技术,别名意见挖掘,相对于普通的数据数值分析,它专攻于分析文本背后的情感色彩,对带有主观情感的文本进行分析处理,归纳推理。从感性的文字中挖掘出客户的意见和情绪,并定量的反应给需要这些数据的人。分析的结果除了正向和负向两极,还有喜怒哀乐等。通过分析这些数据,我们可以定量地了解用户对于某个评论对象的看法,从而在产品质量和商业决策上做出改进。

21世纪以来,情绪分析已经逐渐成为NPL(自然语言处理)最活跃的研究领域之一。由于互联网的快速发展,各类社交媒体用户不断增加,微博微信,论坛博客,还有网上电影,动画等产业不断发展,由此引发了对于情感分析的需求。并且,文本情感分析还在迈向更多其他的领域,如金融政治,市场营销等。无论对于企业还是个人,它都有很大的商业意义。

同时,情感分析甚至可以用于调控和导向社会舆论,及时检测非正常的网络舆论趋势,从而避免互联网环境的恶化,避免恶性事件发生。

按照处理文本的粒度不同,情感分析大致可分为词语级、句子级、篇章级三个研究层次。篇章级归纳总结一大段文字的总体情感倾向正负,是一个二元分类任务。可以将自然语言处理技术与模糊逻辑技术相结合,基于手动创建的模糊情感词典,对新闻故事和电影评论进行情感分析。也可以定义多种情感类别,同一个词语也可以表达多种情绪。句子级情感分析需要分析构成句子的词语的情感,可以基于知识库,网络或语料库进行分析。定义多种不同情感,归类句子并分析情感强度,是主要任务。词语级是基础,可以基于词典,网络,或者语料库来进行分析。其中,语料库方法就是指使用机器学习,训练模型的人工智能方法来进行研究。分析完毕后,使用统计方法输出主要情感倾向,各类情绪的代表句子和观点持有者。也可以对各种词语进行打分,最后总结出一个评论的总体分数以表现情绪的正负。现有的文本情感分析的途径大致可以集合成四类:关键词识别、词汇关联、统计方法和概念级技术,文本情感分析的研究趋势是使用更加高端有效的人工智能来解决问题。

文本情感分析实例

第二篇找到的文献是一个简单的情感分析例子:文本情感分析——电影评论分析。后续的第二篇文章设计机器学习算法,而前半部分可以用来做文本预处理的参考。[2]

该文章内对进行情感分析的第一步骤:基础的文本预处理进行了一个简单的实践。文章最后进行了简单的词汇统计处理,但是很有直观效果,使用了统计图表和云图等,值得参考,可以用于提升展示效果。

文章使用了python语言进行研究,文本预处理的过程包括了文本缺失值重复值处理、分词、去除停用词、文本向量化。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。