扩展词典与规则结合的微博情感分类研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:aliuyangba
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术和社交网络服务的迅速发展,我国微博用户数量越来越多,尤其以新浪微博为主。加之web2.0的提出与兴起,互联网赋予网民更多主动,微博凭借其简洁、灵活的特点渗透到广大网民的生活中,成为用户获取、分享、发表信息的平台,这使得互联网中蕴含情感的文本数量迅速增长。这些文本在舆情控制、市场预测等方面有极大的研究价值,因此挖掘微博情感信息技术应运而生。准确识别微博文本包含的情感,实现面向微博的情感分类,在理论研究和应用层面上都有重要意义。目前情感分类研究中存在情感词典不完善、情感分类准确度不高的问题。为了解决这个问题,本文以语义相似度为基础,面向微博情感分类问题提出基于点互信息和语义相似度的扩展词典构建方法,并归纳情感表达的六种情感单元组合形式。然后将该词典与语义规则相结合完成情感分类任务,有效识别微博文本所蕴含的情感。主要研究工作有:首先,进行词典扩展的研究,整理现有情感词典资源,提出构建面向微博情感分类专用词典的方法。将二分类词典和多分类词典按照词语相似度进行合并,按照七分类情感划分体系整理情感词典;收集网络词汇和表情符号,利用点互信息进行情感判定构建网络词词典和表情符号词典,并详细说明各部词典构建规则。然后,综合考虑情感词典扩充时,情感词规模和情感词识别准确度对微博文本情感分类的影响,对比词典合并过程中相似度阈值对情感识别有效性和准确性的影响,确定合适的相似度取值范围,使其提高微博情感识别率。最后,进行情感分类方法研究,基于微博文本表达特点,分析基于情感词典进行情感分类方法的不足,归纳出微博文本情感单元组合形式,提出词典与规则结合的情感分类方法。将扩展词典与文本语义规则结合,通过计算情感单元的情感强度值得到文本情感类别。针对扩充词典和将词典与规则结合用于情感分类这两个研究主题,设计相应的对比试验。通过实验证明本文提出的方法,在手动获取以及公开测评数据集上有良好表现。
其他文献
烯烃是能源化工中重要的大宗化工原料之一,与其相关的转化反应一直受到广大科研工作者的关注。通过合适的化学转化对烯烃进行官能化得到附加值更高的化学品,具有重要的理论及
随着移动网络的快速发展,移动网络应用迅速增加,目前中国在网活跃移动智能设备数量达到8.99亿,移动互联网视频业务正成为移动互联网流量的主要入口,监测网络视频指标对于视频
近年来,在党的领导下,我国的高校思想政治教育逐渐呈现出了全面加强和创新发展的趋势,而全过程育人理念的提出,更是为高校思想政治教育工作的开展指明了方向。在这样的背景下,学术界也涌现出了大量与之相关的文献资料,但是仍然缺乏以具体地区为对象的系统性研究成果,相关理论研究仍然有待进一步完善。本文运用文献分析法、调查问卷法、访谈法和综合研究法,对合肥市高校大学生思想政治教育全过程育人现状进行了系统性研究,从
在认知语言学的层面上,隐喻已经不再是一种单纯的语言现象,而是人在认知过程中的一种思维方式。根据人类从近到远,从简单到复杂的的认知规律,人类对自身的身体经验往往成为认
目的:探索CLU、CNTNAP2基因多态性位点与不同性别新疆维吾尔族人群剥脱综合征发病风险之间的关联。方法:采用病例对照研究设计,于2015年11月—2017年2月收集251例新疆维吾尔
目的研究助听器干预对感音神经性听力损失(sensorineural hearing loss,SNHL)伴重振患者短增量敏感指数(short increment sensitivity Index,SISI)测试以及不适阈(uncomforta
表面增强拉曼散射(Surface enhanced Raman scattering,SERS)由于物理增强和化学增强使得拉曼信号得到放大,进而实现超灵敏、高选择性、非破坏性的快速检测,已被广泛应用到生
直接甲醇燃料电池(Direct Methanol Fuel Cell,DMFC)具有较高的能量转换效率和环境友好等优点,在便携式电子产品及车载动力领域有着良好的应用前景。Pt基催化材料是目前对甲醇
甘蓝型油菜(Brassica napus,AACC,2n=38)属十字花科芸薹属植物,是我国主要的油料作物。油菜花序通常为无限花序,是油菜重要的组织,其上着生角果,而角果内着生种子,最终决定油菜的产量。本文报道了一个新发现的有限花序自然突变体,该突变体末端着生一朵终止花,能够实现油菜开花和结角的提前终止,可为油菜的株型调控和选育适合机械化收获的油菜品种提供新思路。围绕新发现的有限花序突变体,本研究
目的:探讨混合现实技术(Mi xed Reali ty,简称MR)在后腹腔镜下肾部分切除术中的应用效果。方法:选取我院2017年9月—2019年9月收治104例经后腹腔镜下肾部分切除术患者作为研究对象。术前均常规行心电图(Electrocardiogram,ECG)、肺功能检查、彩超、螺旋CT泌尿系成像(Computed Tomography Urography,CTU)、螺旋CT动脉成像(Com