面向话题型微博评论的观点识别及其情感倾向分析研究

被引量 : 0次 | 上传用户:gjsh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网在中国的普及,人们的生活方式也逐渐地发生变化,越来越多的人通过互联网获取和发布信息。广大互联网用户开始在微博上传播政治话题、体育话题、娱乐话题。每天都有大量的具有分析价值的微博评论产生,这些评论信息包含大量情感信息和观点。微博研究已经成为热点。通过对中文微博情感分析相关文献的研究,发现微博情感分类方法主要有两类:基于情感词典的方法和基于机器学习的方法。由于中文语法复杂,基于机器学习的方法无法保留了情感相关特征项之间的关系,也无法应对多个情感词和评价对象的情况。而基于情感词典的方法,在情感极性分类过程中,较少考虑到微博话题领域词汇,同时情感词典中的情感词不区分情感词之间情感强弱,这样使得分类结果的准确性受到影响。目前中文微博情感分析缺乏针对性研究,忽略评价对象对情感的极性和强弱影响,而且情感特征项抽取算法也有待改进。针对这些问题,本文采用基于情感词典的方法,选择中文情感词汇本体库作为本文的基础情感词典,有效地改进以往情感词典不区分情感之间情感强弱的缺点。并且采用一种基于HowNet的词汇语义相似度计算方法,构建面向微博话题的领域情感词典。同时考虑到评价对象对微博情感分类的影响,构建合理的评价对象词典。本文采用规则和SVM模型进行观点识别,筛选出和微博话题相关的微博评论,提高情感分析中评论文本的质量。然后对微博评论文本进行相应的文本预处理,并采用平滑算法、语法规则相结合,作为微博评论文本情感特征项抽取方法,对微博评论中的否定词、程度副词、微博表情符号、情感词以及评论中的评价对象做相应的处理。最后本文结合微博评论语句情感计算公式,对评论句的情感倾向进行分类,有效改进了以往微博情感分析的缺陷,实现了一个能够较为合理判断微博评论句情感强弱的计算公式。不同的话题,其领域词典存在不同。本文基于微博话题构建针对性的情感倾向词典和评价对象词典做特定话题的情感分析研究,可以进一步提升情感分析效果。实验数据采用数据堂提供的微博语料,包含生活、交通事故、科技三个领域的微博话题评论数据,实验结果表明,本文设计的观点识别方法和情感分类模型与以往的分类模型对比,观点识别和情感分类效果具有明显提升,说明本文提出的方法具有合理性和有效性。
其他文献
疏星点点,七月的兴化湾畔,习习的凉风让人在闷热的夏夜感受到些许的惬意。福清核电4号机组主控室内,各式仪表显示的参数和盘台上明暗不一的指示灯预示着首次并网前的准备工作正
地高辛是洋地黄最重要的次级强心苷,用于治疗急性和慢性充血性心脏病和室上性心律失常。作为常用的狭窄治疗指数药物之一,地高辛过量会导致一系列心脏疾病。高纯度的地高辛标
以往一些研究者认为盘古即盘瓠,二者音相近,所以盘古是由盘瓠演变而来。事实上,二者是两种不同性质的神话传说与信仰,盘古是开天辟地、化生万物和再生人类的创世始祖;而盘瓠
介绍光刻技术中的曝光设备与技术、光刻工艺及工艺控制在集成电路微细加工中的应用。
近几年物流业的发展备受关注,我们经常看到这样的报道:我国物流成本占GDP比重高达16.7%甚至,而美国只10%左右,于是就会直观地说中国远远落后于发达国家,物流成本管理水平与发
目的:评价、分析全面流程管理在急诊护理管理中的实施与效果。方法:2016年7月~2017年6随机选取医院30名急诊科护理人员,作为研究对象。2016年7~12月设为对照组,2017年1~6月设
学生的首要任务是学习,而考试成绩一直是衡量学生学习效果的重要指标.谈到考试则不得不提“考试焦虑”,尤其是高中生要面临高考这个节点,有研究表明中国高中学生的考试焦虑程度明
金融是现代经济的核心,其安全运行关系着经济发展和社会稳定,作为我国经济发展的信用中介和支付系统,商业银行必然成为了金融风险管理的重点。随着我国金融改革的不断深入,商
纵观世界经济发展趋势,随着当今消费市场竞争的日趋激烈,服装产业发展既面临着新的历史机遇,也面临着更严峻的竞争和挑战。服装企业不断尝试运用新颖的营销方式来发掘复杂的消费
论文以石灰石为原料,针对传统碳酸钙生产工艺中一些不足之处,在课题组前期研究工作的基础上,采用相转移—碳化法制备轻质碳酸钙,考察并确定了较适宜的轻质碳酸钙样品制备工艺条件