NCP疫情网络舆情的情感态势演化分析文献综述

 2021-12-29 21:56:48

全文总字数:3098字

文献综述

1 情感分析

情感分析也称为意见挖掘( Opinion Mining),是自然语言处理(NLP)的一个领域,它构建的系统,用于在文本中识别和提取观点。 通常,除了识别观点之外,这些系统还提取描述的特征,例如极性、主题和意见持有人。极性指发言者表达积极或消极的意见;主题是正在谈论的事情;意见持有人指表达意见的个人或实体[1]

目前,情感分析是一个很有兴趣的话题,因为它有许多实际应用。 由于互联网上公开可用的信息不断增长,在评论网站,论坛,博客和社交媒体中,可以获得大量表达意见的文本。

在情感分析系统的帮助下,这种非结构化信息可以自动转换为结构化数据。如关于产品,服务,品牌,政治或人们可以表达意见的其他主题,这些数据对于商业应用非常有用,例如营销分析、公共关系、产品评论、网络发起人评分、产品反馈和客户服务。

对于情感倾向研究方法和实现方法, 目前主要有两类, 一类是采用情感词典和关联信息进行情感分析, 例如陈晓东通过构建情感词典的方法, 对微博的情感倾向进行测定[2];另一类是采用机器学习相关方法, 例如pang等人采用机器学习的方法, 分别利用朴素贝叶斯、最大熵、支持向量机三种算法进行情感分类, 最终情感分类的准确率达到了80%[3]

2 微博舆情的演化阶段

对于微博舆情的演化阶段和演化动力, 油永华依据关注度和关注度增量两个指标, 将网络舆情发展阶段分成三个阶段, 即快速扩散阶段、稳定发展阶段和衰落阶段, 并以安庆枪击事件为例分析各阶段舆情特点[4];吴晓娟依据微博评论数量和转发数量, 将蓝色钱江放火案的微博舆情发展过程分成起始阶段、爆发阶段、反复阶段、长尾阶段, 并针对各阶段舆情主题做了演变分析[5];兰月新等人通过构建网络舆情传播的 Logistic 模型, 将“成都男子殴打女司机”事件舆情发展划分为五个阶段[6];蒋知义等人依据微博数量将“罗一笑”舆情事件分为五个阶段, 对各阶段平均情感极性强度进行分析[7]

3 微博等短文本研究

与长文本相比,短文本具有内容稀疏、信息单元非密集的特征,将传统的文本分类方法如支持向量机、朴素贝叶斯分类等直接应用于短文本分类任务中很难取得良好的效果。针对此问题,研究者提出了一系列对短文本内容进行扩充的方法,主要包括基于外部语料库的文本特征扩展与基于短文本自身内容特征扩展两个研究方向。

3.1 引入外部语料库实现对文本内容的扩充

外部语料库指知网、维基百科以及搜索引擎等富含丰富文本内容及语义信息的知识库,针对短文本内容稀疏问题,使用外部语料库作为短文本内容扩展的来源可以在一定程度上提升文本内容的信息量,解决短文本内容稀疏的难题。范云杰等[8]利用维基百科中词汇概念间的链接关系建立词汇相关概念集合,以此对短文本进行特征扩展。李湘东[9]等借助知网计算短文本数据集中核心词汇与扩展词汇的语义相似度,在此基础上完成对短文本内容的扩展,但由于知网中的词汇对短文本中词汇的覆盖率有限,影响了扩展的有效性。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。