本体和句法依存结合的微博信息情感分析

来源 :北京化工大学 | 被引量 : 0次 | 上传用户:snakegmj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网的普及,微博作为社交平台已经成为了事件爆发的最快消息来源。对于企业来说,微博用户博文中包含的情感信息成为企业重要决策参考。为了能够方便准确地从微博中获取情感信息,提出了一种基于本体和句法依存相结合的微博情感分析法。将包含核心词的空白本体持久化到数据库,然后利用句法依存原理,从采集的微博数据中提取句法依存关系来进行本体更新,接着提出了一种新的情感权值计算方法,将本体维度信息考虑在内实现情感分析。实验表明,该方法在描绘微博数据情感倾向性上,较其他方法有长足的优势。本文的主要研究内容如下:1.利用核心词的关联名词扩充语料库。网民微博评价数据中,有时会略掉核心词和敏感词,更会为产品起代称,代称所包含的信息条目有时甚至比原称更多,因此只利用原称来分析不够客观和全面。本文利用工具对原始数据进行了降维处理,再从原始数据中获取与原称最相似的名词,然后去爬取所对应的微博数据,以达到扩充语料库的目的。2.利用句法依存关系扩充本体的维度。本体多依赖于手动创建,此方法覆盖维度较少且工作量巨大,对效率会造成极大影响,且维度会出现空维度的情况。本文利用句法依存关系,从微博数据中发现跟核心本体相关的依存关系,然后利用依存关系的相关词来自动扩充本体维度。3.利用句法依存关系扩充本体情感词汇。本体的维度存在一些特定的情感词,是在初始创建时无法预料到的,对于这部分需要在数据中挖掘的词语,本文利用句法依存关系,在数据的遍历中寻找到对应维度的情感词汇,并加入本体系统中,从而达到自动扩充情感词汇的目的。4.利用本体信息提出了一种新的情感权值计算方法。本文提出了一种基于本体维度的情感权值分析方法,该方法将情感词所在的本体维度考虑进去,这样能够充分利用情感词的空间位置信息,避免不重要词语权重过大的情况出现,能够更充分地反映数据整体的情感倾向。5.以“蒙牛”为研究对象,利用工具完成“蒙牛”微博数据的爬取,从中发现核心名词关联名词,然后爬取关联名词微博并进行筛选,接着利用数据完成“蒙牛”本体的持久化和内容扩展,最后计算出情感倾向性。通过实验对比结果,证明本文所构建的新方法在描绘微博数据情感倾向性上,较其他方法有长足的优势。
其他文献
通过梳理2011年高考数学试卷中关于复数的考查情况,对主要考点进行详细解析,对考查亮点进行扫描与赏析,并提出2012年高考数学备考策略.
1987~2000年间,我院采用虎杖液治疗瓦斯烧伤395例,取得了明显效果,现报告如下.
色彩鲜艳且永不褪色的结构色材料在传感器、防伪等领域具有诱人的应用前景。其中引起非彩虹色彩的无序光学结构由于具有物理不可克隆的优势有利于推动防伪技术的革命性进步。本论文通过引入遇水变透明中间层构建遇水显色的多模式防伪标签,并借助人工智能对无序光学结构中微球的随机排列进行识别,发展了基于结构色的物理不可克隆型防伪标签。进一步,通过在无序光学结构中引入智能聚合物网络,发展了应力、温度双重响应的自修复结构
光学天线是传统微波天线在光学谱域的延伸,主要通过表面等离激元(Surface plasmons,SPs)激励效应实现微纳尺度上的光学响应和调控,在高效光学吸波以及高灵敏度光波探测等领域具有广泛应用前景。改变光学天线材质和其特定的微纳结构,将影响对入射光场的响应和调控效能。因此,迫切需要在材料和微纳结构方面深入开展光学天线研究。本文基于金属(Al)及金属氧化物(Indium tin oxide,IT
尖锐湿疣是由人乳头病毒(HPV)感染所引起的性接触性传染性疾病,近年来发病率急剧上升,已引起广泛注意.尖锐湿疣在妊娠期发病率高,生长快.2000~2002年,我们用液氮冷冻术治疗妊
下一代无线通信技术将着力于解决海量用户接入、“万物互联”等问题,而其中的难点之一在于如何在保证可靠性和有效性的同时使得通信的复杂度不至于太高。本文研究的稀疏叠加
副银屑病是一组病因不明的,以红斑、丘疹、浸润及鳞屑而无自觉症状为特征的慢性皮肤病.该病病程较长,易反复,难以根治,日久皮肤呈点滴状红褐斑,浸润浅,其上有白色鳞屑经久不