基于文本分析的情感挖掘模型研究与应用

来源 :电子科技大学 | 被引量 : 5次 | 上传用户:Rita519
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当下互联网技术迭代更新频繁,网络社交媒体更是呈现出蓬勃的发展态势,民众在互联网上发表意见的渠道得到了极大拓展,造成了网络信息资源的极速增长。网络信息资源通常以非结构化数据为主,文本信息作为最典型的非结构化数据占据着极大比例,而且这些文本信息往往都蕴含着用户针对热点事件或品牌口碑的情感倾向,从这些海量的文本中获取有用的情感信息是一件具有挑战性的事情。因此,情感挖掘技术应运而生,该技术主要通过文本分析挖掘其中的情感信息,并对其进行情感分类。其中句子级的情感挖掘技术应用最为广泛,在品牌口碑评价和舆情监控领域都有着较大贡献。本文主要对句子级的情感挖掘方法进行了研究,涉及的主要工作如下:1)基于句法依存分析的情感分类模型研究。传统的情感挖掘方法一般只关注词语本身,忽略句子的句法结构和词语之间的语义关联度,而这些信息在文本情感挖掘中有着重要作用。为此,本文提出了一种基于句法依存分析的情感分类模型,主要包括句子级的情感信息抽取策略和基于KNN算法的依存关系簇情感判别方法,并在NLP&CC 2013数据集上进行了测试。与传统方法相比,该模型的准确率显著提升,召回率基本持平,F1值略微提升,且较容易受到训练集规模的影响。2)基于中文情感词的句子情感倾向性研究。PMI-IR算法作为情感倾向计算领域的典型算法,在英文的语言环境下提出,不能完全适用于中文。另外,该算法采用的标准词单一、情感分类粒度不够,且涉及到发送HTTP请求进行信息检索使得计算比较耗时。本文针对以上缺陷提出了相应的改进策略,包括标准词扩展、细粒度情感倾向分析、定义中文环境下的情感词组抽取模式以及对情感词组的语义倾向结果添加缓存机制。最后通过实验表明,改进后的PMI-IR算法的情感分类效果较好且比较稳定。3)基于文本分析的情感分类系统的设计与实现。本文在提出的基于句法依存分析的情感分类模型和改进的PMI-IR算法基础之上,实现了一个基于文本分析的情感分类系统,用户能够个性化地选择功能模式,最终通过参数配置对文本进行情感分类。
其他文献
网络测量是掌握网络运行状态,理解网络运行规律的重要手段,被动测量是网络测量中获取数据的重要方法。对于获取到的海量被动测量数据,如何了解其特征从而进行更有针对性的测量分
近年来随着智能交通系统ITS(Intelligent Transportation Systems)的兴起,针对车载自组织网络VANETs(Vehicular Ad Hoc Networks)的研究获得了学术界和工业界越来越多的关注。
X光胸片是肺部病变临床检测主要的医学影像检查手段之一。但是临床实践表明,单纯依靠放射医生读片检测X胸片中的病灶,常常会导致很高的病灶漏检率。导致X胸片中病灶漏检的一个
随着信息技术和网络通信技术的发展,即时通信系统的应用得到了飞速的发展,各种即时通信产品层出不穷,比较典型的有QQ、MSN、GTALK等,它们的出现使得在以网络为载体的新世纪出
随着网络的发展,互联网络规模快速膨胀、网络服务呈现多样化,使得现有网络体系在可控性和可信性方面受到严峻挑战,而不能有效控制网络资源造成网络传输质量难以满足用户需求是网
随着现在企业的信息化发展程度的逐步提升,其业务分支日益复杂,企业经营范围逐步向内销加外贸等商业模式转变,企业生产过程中,面临着跨地域、跨组织、跨行业、跨网络等实时信息化
自聚焦是非线性光学中最常见最基本的物理问题之一,从上世纪六十年代起,自聚焦就一直是非线性光学领域热门的研究课题。 从实践的角度来看,自聚焦效应限制了允许通过介
在传统的无线多跳网络中,由于节点移动、信号衰减、障碍物阻碍等原因,网络经常处于间断状态,源节点和目标节点之间大多时候无法建立‘条完整的端到端的路径,导致消息传输失败
  传统的信息检索方式由于其局限性成为了当今检索技术发展的桎梏,为了满足用户的需求,进一步的检索出语义层次的信息,知识检索应运而生。   知识检索主要包括语义检索和语
交互电子技术手册(简称IETM)就是将技术手册的内容转换为数字化,进行重新编制并以交互方式进行查阅通过计算机等设备把所查阅内容展现给维修技术人员或系统操作人员。在IETM的发