面向社交媒体网络的短文本情感分析研究文献综述

 2022-03-14 20:16:37

文献综述

随着社交网络的逐渐成熟和移动终端技术的迅猛发展,微博作为一种新型的社交媒体和信息交流平台,使人们能够更加方便地点评热点事件和表达自己的情感。用户通过微博发布的信息中包含着不同趋向的情感特征,掌握这些信息动向对商家的产品营销,市场规划都有重要意义。另一方面,政府在面对各种社会动向、舆论焦点时,情感分析对掌握群众的声音从而制定更完善的政策也有着巨大的参考意义和价值。[1]

而具体到微博这一特定的社交平台,其具有即时便捷、媒体化、社交化的特点。作为社会化媒体平台,微博已经成为网民获取资讯信息的主要途径之一。遗憾的是,目前针对中文微博情感分析方面的研究工作十分少,而且微博服务商前还没有考虑任何观点及情感分析方面的因素。因此,针对中文微博的情感分析成为较为迫切的需求。[9]

一、文本的采集和预处理[1]

微博文本一般有三种采集方法:基于新浪 API 的微博采集方法,基于微博爬虫的采集方法,基于百度微博搜索的采集方法。

同时,微博短文中通常包含显著的个人意图和明显的个人主义感情色彩。具有半结构化的特点,除了文本内容还包含一些元数据,如:发布时间、收藏数量、转发量、评论等。采集得到的微博短文本含有大量的噪音,低质量的文本会降低情感分析的性能,因此需要在对微博进行情感分析处理之前先对短文本进行预处理。微博短文本预处理主要包括繁体字转换、微博交互信息过滤、微博分词、词性标注等。

二、情感分析

  1. 基于机器学习的情感分析方法

机器学习情感分析,即选出一部分积极情感的文本与消极情感的文本,之后用机器学习方法进行训练,得出情感分类器,再通过这个情感分类器对所有文本进行积极与消极的二分分类,主要分为有监督和半监督方法。利用机器学习判断待测文本的情感倾向,即积极或消极。常见的分类模型有支持向量机(SVM)、朴素贝叶斯(NB)等,最终分类效果取决于训练文本的选择以及正确的情感标注。[2]

有监督学习方法认为情感分类是一个针对标记训练文档的标准模式分类问题。Pang等人首次将有监督学习方法应用到情感分类中。机器学习算法既可用于主客观分类又可用于正负面情感分类,无需深入对情感词进行细粒度分析,实现更容易。[8]

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。