基于情感词网的短文本情感分类方法研究

来源 :西南科技大学 | 被引量 : 0次 | 上传用户:hyb332145820
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着微博、博客、论坛等web2.0应用的迅猛发展,网民的参与度越来越高。因此,网络上产生了大量的用户生成文本(User Generated Text)。通过对这些短文本进行全面的分析挖掘,可以了解广大网民对于社会事件、人物、产品的看法以及舆论演化趋势。因此,分析处理这些文本信息变得尤为重要,文本情感分析就是其中主要的核心技术。本文对短文本的特征进行了分析,针对短文本的情感分析开展了一下工作:首先,构建情感词网。利用非负矩阵分解方法基于大规模语料库和同义词集合构建可以表示词-词、词-对象之间关系的情感词网。实验证明了情感词网在情感分析领域的有效性。接着,提出了结合情感词网的短文本情感分类方法。该方法通过情感词网对短文本的特征在权重和特征集合方面进行扩展,并结合机器学习分类方法进行情感分类。实验表明,该方法具有较高的准确率和召回率,有效地解决了短文本情感分类中的文本度、特征稀疏、信息量不足等问题。最后,将情感分析应用在网络舆情演化分析中。本文以微博作为研究对象,针对类似微博这样的短文本数据的特点,从情感的角度出发,将文本的情感值作为特征对微博数据进行时间分片,然后使用DTM模型对分片后的数据进行话题演化分析。实验表明,该方法能较好的划分微博数据,有效地找到舆情变化的时间点。
其他文献
在智能交通系统(Intelligent Transportation Systems,ITS)中,最近邻(NearestNeighbor,NN)查询是研究的重点问题之一,它用来找出交通路网中离查询对象最近的目标对象,尤其是查询
目前,超声成像设备因其价格低廉、操作简单、对人体无损伤等优点,已广泛应用于临床医学诊断。但是,由于本身成像机制的原因,在成像过程中无法避免回波及散射波的干涉效应,导
随着WEB技术的广泛应用,许多企业都迫切要求快速,高效地构建自己的WEB业务系统。企业版(J2EE)是SUN提供的一个标准的企业应用开发平台,它为我们开发企业WEB应用提供了丰富的技术
图像的语义分割是指将图像分割成具有一定语义含义的分割块,并对每个分割块进行相应的语义标识,是基于内容的图像压缩、图像检索等多媒体应用领域中的关键技术。把图像分割和
模型检测作为一种自动验证有限状态系统是否满足规范的形式化技术,在规划和多智能体系统等人工智能领域得到了越来越多的应用。现在已经开发出多个多智能体系统的模型检测工具
工作流是通过将工作活动分解成定义良好的任务、角色、规则和过程来进行执行和监控,达到提高生产组织水平和工作效率的目的,为企业更好地实现经营目标提供了先进的手段。迁移
在无线传感器网络中,路由协议是主要的核心技术。其中地理位置路由算法是无线传感网络中非常重要的一类路由算法,该算法运行简单高效并具有低负载的特点。其中,贪婪地理路由
随着高校招生规模的不断扩大,高校教务管理工作就越来越成为高校日常管理工作的重要组成部分,教务管理的信息化,也随着计算机技术的发展,在不断地完善提高。教务管理信息的多样化
进入新世纪,随着“科学技术成为第一生产力”的时代即新经济时代的来临,传统的商业模式正经历着根本性的变革。在很多行业中,产品的同质化使企业难以依靠产品差别来细分市场并创
随着仪器在各个领域的大量使用,从研究实验室到工业厂房,自动化仪器无处不在。人们意识到收集随时间变迁的数据有用起来,自然就需要某种方法来捕捉并完成数据记录。一旦计算机被连接到仪器,数据收集、分析和控制等等功能就可以自由扩展。借助已经发展成熟并且广泛应用的网络技术,实现仪器的网络化和智能化。仪器测量系统已经从传统的RS232、CAN、USB等总线测量系统发展到以互联网技术应用为基础的LAN总线网络化测