基于表情符号的腾讯微博情感倾向研究

来源 :南京师范大学 | 被引量 : 0次 | 上传用户:DK7531672
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微博现已成为基于社交关系的浏览传播发布信息的综合类社交媒体平台,对微博的情感分析是目前自然语言处理(NLP,Natural Language Processing)领域非常热门的一个方向,也成为关注网络舆情的重要数据。在数字化信息爆炸的大数据时代,如何快速掌握大众情感走向,节约分析成本,是本文的研究目的。本文观察到微博中含有大量表情符号,这些表情符号所包含的情感信息不容忽视,甚至在一定程度上代表了该条微博文本的情感。如果可以划分出表情符号的情感类别,并用表情符号的情感类别代表其所在文本的情感,则可能节省微博情感分析工作约16%的工作量。在此基础上,本文提出一种基于表情符号来研究微博的情感倾向的方法,将情感分为细粒度的乐、好、怒、哀、惧、恶、惊七大类。利用Ansj分词工具和大连理工情感词汇本体库对微博文本进行分词和量化操作,采用词典和简单规则相结合的方法计算出微博的情感值并归类出情感类别和极性,赋予该微博中出现的表情符号,构建表情符号情感词典,判断构建的表情符号情感词典的准确性。初步实验结果表明采用词典和简单规则相结合的方法得到的情感值和情感极性经过修正后正确性能达到83.2%,而情感类别准确性太低。于是提出一种基于人工标注和表情符号关联的方法,人工标注部分表情符号的情感类别,制定规则对与已标注类别的表情关联度高的表情符号进行类别划分,依次迭代,判断出未标注的表情符号情感类别,更新表情符号情感词典,并判断是否能由微博包含的表情符号的情感来代表整条微博的情感。最终得到对乐、好、恶三类情感识别最佳,正确率达到90%以上,怒、哀两类正确率达到80%以上,惧、惊两类正确率超过70%,实验最终说明使用表情符号的情感类别代表微博的情感类别是可行的。
其他文献
随着汽车保有量以及驾驶人员的不断增加,如何使车辆在行驶过程中保证安全稳定已经成为重中之重,同时现有法规对于车辆排放的要求越来越严格,所以提高车辆行驶安全性以及降低车辆排放成为热点问题。在同等条件下,铝合金车轮较于钢材车轮由于质量轻、散热性好被广泛应用于汽车中,通过对车轮的弯曲疲劳分析、径向疲劳分析以及随机振动分析可对车轮结构进行优化,从而提高其安全性。本文以有限元方法为依托,利用Stearns.J
农村商业银行作为我国农村金融服务主力军,是三农和小微企业的主要融资渠道,农商行肩负着为农村地区提供金融服务的同时,又肩负着推动农村经济发展的重任。其自身的健康发展对于稳定农村经济,保证社会协调有序运转起着不可估量的作用。如今,各地农商行正如雨后春笋般快速发展,在快速的发展过程中,其面临的信贷风险问题逐渐开始暴露。石雕产业作为Q县支柱型产业之一,年产值规模达数十亿元人民币,从业者达3万多人,全县石雕
随着中国综合国力的不断提高和中泰友好关系的深入发展,汉语热在泰国各地迅速升温。学习汉语的泰国人数日益增加,截至目前泰国已经开设了16所孔子学院、11所孔子课堂,3000多所学校开设了汉语课程。泰国本土汉语教师的数量也随着泰国汉语学习的深入越来越庞大。然而泰国本土汉语教师的汉语发音现状并没有随着汉语教师数量的增加而得到改善,大部分教师的汉语发音问题是在他们学习汉语之初就产生并一直没有得到解决。标准的
末次冰期(Last glacial period)气候变化以突然的、千年尺度气候事件的气候变化为主要特征,以Dansgarrd-Oeschger事件(DO事件)和Heinrich事件(H事件)最为显著。其中,Marine isotope stages 3/2(MIS3/2)转换期是古气候变化研究的焦点,随着高分辨率地质记录的出现,关于MIS3/2转换期的研究日益丰富。然而,此前关于该时段的石笋研究
改革开放以来,建筑业一直是我国的支柱产业,随着城市的大力建设和发展,数以万计的建筑垃圾日益剧增,从老旧建筑物拆卸的建筑垃圾,不仅侵占大量城市空间和土地资源,还会污染空气,这与国家大力倡导绿色经济和可持续发展战略背道而驰,如何处理这些城市建筑垃圾成为亟待解决的问题。再生混凝土变废为宝为人们所利用,不仅解决建筑垃圾占用土地空间问题,还能节约天然砂石等原材料资源,既经济又环保。本文以高寒地区再生混凝土为
冲击地压的频繁发生严重影响了深层煤炭的开采并且对工作人员以及设备造成很大伤亡和损失,因此冲击地压的防治是亟待解决的问题。防冲吸能支护液压支架对冲击地压的防治具有非常积极的效果,其吸能构件承担了主要的防冲吸能。目前应用于防冲液压支架顶梁的吸能构件以及其相应的对比研究较少,因此研究防冲液压支架顶梁吸能构件具有重要的意义。本文根据防冲吸能液压支架顶梁参数,提出了瓦楞层叠式吸能构件,同时确定了三角形、梯形
目的:分析目前国内药物重定位领域的主要研究主题和研究主题的演化过程,从而揭示药物重定位研究现状,展现其研究脉络。方法:首先使用计算机检索期刊数据库中药物重定位领域相关文献,经筛选后最终纳入229篇文献。然后基于混合关键词策略筛选文献的主要主题特征词,并围绕主要主题特征词进行网络可视化、聚类分析和演化分析。最后对该领域的研究热点和发展脉络进行了梳理与讨论。结果:国内关于药物重定位领域的研究按研究方法
闪烁现象是指某种物质在带有一定能量的粒子的作用下,发出荧光的现象,而这些能发出荧光的物质被称作闪烁体。闪烁体按照物质的成分可以分为有机闪烁体和无机闪烁体,按照物质的状态可以分为气态闪烁体、液态闪烁体和固态闪烁体。随着光电技术的不断发展,不同种类的闪烁体可以与多种光学探测器件组合,以适应不同的应用领域和物理目标,从而逐渐成为核物理与粒子物理实验中重要的探测器之一。因此,在高能物理实验中,闪烁体是一种
VideoLog井下电视为油气井可视化检测提供了一种全新的检测技术,在套损检测、落鱼打捞、井下作业质量评价和井下事故处理中取得了广泛的应用。井下电视检测的结果是视频资料,对套管问题的发现依赖于人工目测,不仅耗费人工成本,还容易因为测井人员的经验不足导致判断失误。随着图像处理技术的不断发展,本文基于实验室研发的VideoLog井下电视仪器,研发了一款与其配套的视频处理软件。将传统的可视化测井与新颖的
将巷道转弯、存在障碍物、突扩、突缩、分岔、汇合、存在风窗等导致巷道断面形式发生变化的情形称为巷道断面几何特征突变。矿井风流流经巷道断面几何特征突变地点会产生局部阻力,而局部阻力的大小与其流场结构及特征有关,流场的结构不仅仅影响着局部阻力大小,又影响着局部阻力测试,局部阻力测试测点位置的确定及测试方法的选择是准确测定局部阻力的关键。为了能够确定局部阻力测试的合理位置,本文通过PIV实验对不同拐弯角度