微博评论情感倾向性分类研究

来源 :天津科技大学 | 被引量 : 0次 | 上传用户:gnaixug
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的快速发展,网络不仅成为人们信息交流的日常工具,也是一个影响人们生活的重要新闻传播工具,研究网络舆情具有重要意义。如今,网络信息资源十分庞大,仅一条微博的评论数量便可达到几千甚至上万条,微博评论的自动情感倾向性分类可以快速且准确地分析这些评论的褒贬态度。中文微博评论情感倾向性分类的基础是中文分词,中文分词的性能影响着情感倾向性分类的处理性能。本文主要研究的是基于中文分词的微博评论情感倾向性分类方法。  首先,本文提出了一种基于双哈希结构的整词二分词典,该词典机制适用于逆向最大匹配分词方法,在与已有的整词二分词典机制的对比实验中,本文提出的词典机制表现最好,能够提高逆向最大匹配方法的分词速率。  然后,由于微博用语中新词出现率较高,本文选择了未登录词识别能力较强的条件随机场分词方法进行分词处理,并改进了其在成语识别方面的不足。实验表明,优化的条件随机场分词方法的处理结果更为准确。  最后,本文利用辅助的情感词典对文本进行情感倾向性分类,所使用的分类方法共分两步:第一步,对文本进行中文分词处理,并计算文本中所有句子的情感值;第二步,根据文本中所有句子的情感值计算文本的整体情感值,并根据情感值对文本进行分类。实验证明,所使用的情感分类方法能够达到对文本进行情感分类的目的。  本文设计了微博评论情感倾向性分类系统,该系统能够自动下载微博的评论文本,并且进行情感分类。该系统的优点是使用简单、易于分析、处理结果比较准确。
其他文献
普遍网络化孕育出的无线传感器网络是一种全新的信息获取和处理技术,它在诸如军事、环境监测和预报、健康护理、智能家居、城市交通以及空间探索等领域有着广阔的应用前景。
一直以来互联网网络和各应用服务器主要提供尽力而为的服务,直到近几年才有部分运营商网络对个别业务提供了区别服务,但仍没有达到为用户提供质量有保证的应用服务的程度。因此
与基于客户端/服务器方式的流媒体传输网络架构不同,在P2P网络中,充分利用了客户机资源,减轻了服务器的压力,满足大量用户访问的同时使用户得到高质量的服务,因此P2P流媒体技
随着网络技术的发展,流媒体技术也在不断地发展,流媒体技术广泛的应用于网络电视、视频会议系统、视频监控系统等场合。现在,人们对流媒体的要求越来越高的情况下,要提高视频
地理信息系统(GIS)是以采集、存储、管理、描述和分析与地球表面及空间地理分布有关的数据的信息系统。从GIS的诞生到现在,经历了40多年的发展,它已经进入了一个多样化的阶段,并
本文主要探讨基于XML的演示文稿文档格式转换技术。演示文稿在日常工作交流等方面发挥着重要作用,通常与文字处理、电子表格一起作为办公软件的重要组成部分。但办公文档格式
随着我国信息产业技术的发展,网络信息资源数量剧增,跨平台、跨领域、跨地域的信息资源整合与共享困难重重。本文通过数据仓库技术与Web Services技术相结合的方式提出了基于
随着云计算等网络技术的快速发展,云数据中心需要向多个租户提供虚拟网络以保证租户间的应用互不影响。当前IP网络由于控制逻辑和数据转发功能的紧耦合,使得部署多租户虚拟网
移动通信具有简单快捷、实时方便的特点,已经受到越来越广泛的关注。本文所研究的网络服务平台是一个将传统电子政务与移动通信相结合,通过手机短信和便民服务平台两种方式采