微博观点句识别及特定目标情感分析方法研究

来源 :昆明理工大学 | 被引量 : 0次 | 上传用户:pconeone
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社交媒体的发展,网络上出现了很多新型的社交平台,网民可以借助这些社交平台,诸如博客,微博和购物网站等等,实时的表达自己的观点并且和其他网民交流。而由于互联网的发展,每天这些平台上的用户产生的信息都是海量的,如何对于这些信息进行有效的挖掘就是一件有意义的事。本文的研究方向是情感分析,微博是用户交流的重要平台,通过对微博数据的分析,可以满足现今舆情分析以及商业应用的需要。本文基于神经网络和支持向量机研究了关于观点句识别及特定目标情感分析问题。经过研究和探讨,以及对现有工作的总结,本文围绕了观点句识别及特定目标情感分析方法进行了研究,主要进行了以下研究:1.基于自注意力双向门控循环单元和支持向量机的微博观点句识别针对现有的方法依赖于人工进行特征选择,以及提取的数据稀疏的问题,提出了基于自注意力双向门控循环单元(Bi GRU)和支持向量机(SVM)相结合的方法,该方法可以自动地学习出句子中的有效特征。引入自注意力,使得模型对句子中重点特征有更多的注意力权重,之后生成出一个二维的句嵌入矩阵,矩阵中的每一个向量都代表的是句子中的不同部分。该方法通过Bi GRU结合自注意力,得到句嵌入矩阵;将句嵌入矩阵转化成向量形式,之后还需将句嵌入向量输入到SVM分类器一起进行训练,最后由SVM分类器输出分类结果。与SVM和自注意力Bi LSTM这两个模型相比,本方法是基于以上两种方法的融合,有效的提高观点句识别的精确率。2.基于长短期记忆网络和门控卷积神经网络的特定目标情感分析研究基于特定目标的情感分析是很有挑战性的工作,主要的难点在于怎样加强特定目标与上下文之间的联系,还要考虑到不同语境下目标词对句子情感极性的影响。针对以上的考虑,我们使用长短期记忆网络(LSTM)和门控卷积神经网络相结合的方法来对特定目标进行情感分析。本方法是将目标词向量和词向量相拼接,得到两者的融合向量,之后输入到LSTM中,得到带有目标词信息的隐藏层状态;之后将隐藏层状态,输入到门控卷积神经网络中,之后门控卷积神经网络输出与目标词相关的情感特征,最后输出层由softmax输出分类结果。与门控卷积神经网络模型相比,本方法取得了更高的精确率。利用研究结果,设计并开发了基于微博观点句识别和特定目标情感分析的原型系统,介绍了系统搭建所需工具和系统框架,详细阐述系统的设计过程。实现了微博观点句识别和特定目标情感分析。
其他文献
近年来,我国的文化产业蓬勃发展,在国家相关政策引导下,民众对中华民族传统文化有了高度认同和学习需求,国学教育不断升温并逐渐形成普及的趋势。随着“一带一路”合作倡导的提出,国学经典作为中华传统文化的优秀典范,对提高国家文化软实力,增强国家核心竞争力具有重要意义。当今社会大众国学热的兴起,国人对中华传统优秀文化的认同感和自信心逐渐增强,促使越来越多的音乐教育工作者开始将传统国学经典纳入音乐课堂教学。本
城市环境作为车载导航系统的典型应用场景,因其存在遮挡频繁、多径效应显著等特征,已成为车载导航技术的重点和难点。GNSS/INS组合系统作为车载导航系统的核心部件,现有的方法多采用单频GNSS信号,模糊度固定较为困难,容易出现浮点解,定位精度和可用性难以保证。多频GNSS信号具有模糊度能够单历元固定的优点,在卫星信号恢复后能够迅速消除定位误差,适用于城市环境等频繁遮挡场景。另一方面,GNSS/INS
本文利用2007年-2016年沪深A股非金融类上市公司的面板数据,探究和检验实体企业金融化对股价崩盘风险的影响和机制,并考虑了金融化期限结构和企业属性的异质性影响。研究表明,总样本中,企业短期金融化加剧了其股价崩盘风险,长期金融化降低了股价崩盘风险,而整体金融化对股价的影响较小;子样本中,制造业企业整体金融化有显著负面影响,民营、高科技、制造业企业短期金融化的不利影响更强;经济政策不确定性和金融活
当前嵌入式系统性能快速提升,发展非常迅猛,在不同的场景下都有大量的应用。随着嵌入式系统的普及,针对嵌入式系统的攻击也开始多了起来,但是面向嵌入式系统的安全防护目前发展还不够成熟。已有研究表明,在嵌入式系统中使用可信计算技术是一种切实可行的安全防护方案,国际可信计算组织(TCG)推荐的可信计算技术基于可信链建立思路,对从嵌入式系统上电开始到操作系统中应用程序运行的整个过程建立可信链。但是当前TCG推
本文以二油酰磷脂酰乙醇胺(1,2-dioleoyl-sn-glycero-3-phosphoethanolamine,DOPE)和 3β-[N-(N’,N’-二 甲基胺 乙基)胺基 甲 酰基]胆 固 醇(3β-[N-(N’,N’-dimethylaminoethane)-carbamoyl]cholesterol hydrochloride,DC-Chol)为膜材制备阳离子脂质体(cationic
在古代动物形象常常作为图腾的原型,人们为了表达出美好愿望,创造出了很多不存在的动物,譬如龙。不同的动物有其不同的寓意,象征的含义也不同,因此在设计运用这些元素能够准确传达出设计语言,这比用抽象符号更能让人们理解和接受。对于一个国家来说,动物的往往能够用来象征着这个国家,例如非常典型的中国熊猫,作为中国的国宝闻名世界,人们只要看到它的样子就会联想到中国。除了地域象征,动物的形象也是设计师们热衷的设计
2,3-丁二醇(2,3-Butanediol,2,3-BD)是一种重要的平台化合物,广泛应用在化工、食品、医药以及航空航天等多个领域。目前国内外对其需求量巨大,在石油紧缺的背景下,人们主要采用微生物发酵法进行生产。然而,目前生产2,3-丁二醇的菌株大都具有致病性,违背了大规模工业化生产的安全性原则。因此,选择安全无致病性菌株进行2,3-丁二醇的生产已经成为了国内外的研究热点。酿酒酵母(Saccha
森林是地球之肺,在地球生态圈中具有不可替代的作用,发挥着调节气候、涵养水土、保持生物多样性的功能,还能为人类提供丰富的木材和各种林副产品。沅江流域位处湘、鄂、渝、黔毗连地带,历史上原始森林茂密,生息着土家、苗族、侗族等少数民族,是我国南方重要的林木产区之一。随着中央王朝对西南地区经略的不断深入,该流域在明代至民国(1368-1949)近六百年间得到了空前的开发,森林面貌从原始自然林向人工林迅速转变
宁夏是我国西北地区的主要生态屏障,针茅属(Stipa)植物作为宁夏草原的建群种和优势种,是重要的植物资源,对宁夏天然草原的恢复有着重要意义。本文以宁夏草原6种针茅属植物叶片为研究对象,使用石蜡切片法观察了叶片解剖结构特征,测定了叶片、上表皮细胞、下表皮细胞和栅栏组织厚度、主维管束面积等6项指标,研究了叶片解剖结构与生态因子之间的关系,利用冗余分析(RDA)及方差分解探讨各生态因子对叶片解剖结构的贡
宝山铅锌多金属矿区,位于湖南省郴州市桂阳县城南西约2千米处。1966年建矿,矿山经40余年的开采,浅部矿产资源逐渐枯竭,目前开采深度达-190米深部,急需寻找接替资源。坑道重力有受电磁干扰较小、更接近探测目标体观测等优点,故选择高精度坑道重力方法来开展宝山矿区深部找矿定位预测研究。经矿区-110、-270中段坑道重力及X、Y、Z三方向重力梯度测量,坑道重力观测数据各项改正(固体潮改正、温度改正、倾