情感极性转移现象研究及应用

来源 :苏州大学 | 被引量 : 0次 | 上传用户:xjw308
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着互联网的迅速发展,网络已经成为了消费者反馈观点的主要途径。网络上包括的大量评论信息不仅仅为商家提供了一个信息展示的平台,也为消费者提供了产品使用体验交流的平台。但是面对如此庞大的信息和数据,如果仅凭借人工阅读的方式,不仅耗费大量的时间且容易产生错误,因此,迫切的需要一种有效的手段对各种大量数据进行整理,以直观的方式对统计结果进行展示。在这一大背景下,情感分析任务就应运而生。文本情感极性分类作为情感分析研究中重要研究课题之一,反映了一个文本它是否支持某种观点的情况,一般分为正/负极性两种分类。目前,情感分类已经成为自然语言处理中的一个热点研究问题。但是,由于文本的情感表达方式复杂,情感的极性判断效果往往并不理想。其中,影响情感极性分类的一个主要原因是文本中情感极性转移现象,即指一个情感词的极性因为其他词或短语的影响而发生了改变或是反转。本文则着眼于文本情感表达中的情感极性转移现象的研究,研究内容主要包括以下几个方面:首先,文本分析了情感极性转移现象研究并构建了相关语料库。本文通过观察语料,分析研究语料文本中的改变词语情感极性的各种语言现象,并提出了情感极性转移的体系结构,总结出改变句子中情感词极性的四种语言现象,具体包括:否定结构,对比转折结构,模态结构和隐含结构。在此体系结构下,本文对语料中情感极性转移情况做了详细的标注,重点标注了引起情感词发生极性转移的不同类型的触发词。结合语料,给出了各种类型的统计分析和比较研究。其次,本文提出了情感极性转移自动检测方法研究。根据上一步研究的引起情感词发生情感极性转移的结构类型及总结的触发词表,分别提出了两种自动检测方法:基于规则的检测方法和基于机器学习分类的检测方法。其中,基于规则的方法应用相应触发词表,对各种不同类型的情感极性转移结构做了自动特征检测;基于机器学习分类的方法则使用已有的关于情感极性转移的标注语料,训练机器学习分类器,从而进行自动检测。实验详细比较这两种自动检测方法的有效性。最后,本文将情感极性转移检测应用在情感分类中。在给定某个情感词典的情况下,本文将上述两种情感极性转移检测方法自动检测情感文本中的情感词发生情感极性转移现象,并分别结合基于词计数(Termcounting)和基于二部图的情感分类方法,实现了考虑情感极性转移的情感分类方法。实验结果表明,考虑情感极性转移情况可以明显提高情感分类的整体性能。
其他文献
大数据时代,海量知识让人目不暇接,大脑获取的大部分知识来自于视觉,而视觉是最容易获取信息的感官,提升阅读体验成为未来信息领域的核心追求。然而,推进剂配方概念设计过程
网络技术的快速发展带动了网络应用范围的扩大,随之出现了网络安全问题。目前网络攻击手段多达数千种,应对网络安全问题,除了防火墙,比较有效的措施是入侵检测系统。作为主动
随着我国社会经济的高速发展,环境污染问题尤其是空气污染问题越来越严重,引起了社会各界的广泛关注。空气质量预测是研究和治理空气污染问题的重要内容,目前世界上比较先进的空
大规模平行语料库是机器翻译、跨语言信息检索等自然语言处理应用的重要资源。互联网上存在着海量的多语言平行资源,以往的一些研究都致力于从一些多语网站中获取平行(即互为
传统秘密图像分存技术需要对图像的所有数据进行处理,由于图像数据量大,所以算法执行时间比较长,而且分存算法产生的数据总量与原始图像数据量相比扩张明显,会对网络传输和存
在计算机视觉研究领域中运动物体检测跟踪已成为了一个热点问题。视频监控中运动物体跟踪如何避免受到目标变化、场景复杂、发生变形等因素的干扰,实现目标识别、目标行为分析
在机会网络中移动终端设备能量受限的特点是影响机会网络应用大规模普及的重要因素之一。如何以能量有效利用的方式完成协作感知任务,达到较低的消息传输延迟和较好的消息投
环境污染问题一直是个大问题,困扰着人们的工作、生活和学习。污染物的监测也越来越受到人们的瞩目,污染源在线监测系统成为解决环境污染的有效途径之一。通常情况下,污染源在线
在现代信息社会里,表单是政府和各种企事业单位日常工作中常用的信息载体。传统电子表单普遍存在代码复用率低、开发效率低下、开发周期长、开发成本高等各种常见问题。随着
协同过滤是推荐系统中最流行且最成功的推荐算法。它基于群体智慧的思想,为目标用户选取行为最接近的邻居用户并根据邻居用户的喜好为目标用户进行推荐。协同过滤算法在帮助