【摘 要】
:
近年来,得益于计算机技术的蓬勃发展和互联网设施的全面普及,全球互联网用户在各大网络平台上产出了海量的文本数据,为商家甄别用户喜好、政府监控分析舆情、平台挖掘用户兴趣提供了重要的数据支撑,而这一过程需要采用各种方法来深入探索文本中的情感信息,文档级情感分类便是其中之一。情感分类任务在经过长时间的发展以后,在许多场景都已有较为成熟的应用。然而,目前的情感分类任务仍有以下两大挑战:第一,网络平台中情绪表
论文部分内容阅读
近年来,得益于计算机技术的蓬勃发展和互联网设施的全面普及,全球互联网用户在各大网络平台上产出了海量的文本数据,为商家甄别用户喜好、政府监控分析舆情、平台挖掘用户兴趣提供了重要的数据支撑,而这一过程需要采用各种方法来深入探索文本中的情感信息,文档级情感分类便是其中之一。情感分类任务在经过长时间的发展以后,在许多场景都已有较为成熟的应用。然而,目前的情感分类任务仍有以下两大挑战:第一,网络平台中情绪表达方式灵活多变,单词语义常随使用环境的不同而不同,而目前的词向量表征方法将单词映射为一个固定的词向量,无法适应单词词义多变的特点;第二,现有的情感分类方法常常将文档作为一个基本输入单位进行处理,无法充分利用文档的层级结构信息,为进一步深入挖掘文档中的情感信息带来了阻碍。针对以上问题,本文研究了基于动态词向量与层级神经网络的文档级情感分类方法。本文创新点总结如下:(1)使用基于ELMo(Embeddings from Language Models)的语言模型生成动态词向量,该词向量可根据单词的上下文环境得到实际语义,解决了传统单词表征方法中多义词的问题,并在该单词表征方法的基础上提出了一种将BiGRU(Bidirectional Gated Units,双向门控循环神经网络)和CNN(Convolutional Neural Networks,卷积神经网络)相结合的层级神经网络HieNN-DWE,该网络不仅可充分利用文档的层级结构,而且可以结合BiGRU和CNN的优势,深入挖掘文档中的全局特征依赖和句子间的语义联系。(2)针对ELMo模型的不足,提出了基于情感词典的动态词向量生成方法SL-ELMo(Sentiment Lexicon based ELMo),该方法在输入层引入情感词典和掩码语言模型,并在后续层中采用双向Gated CNN来提取单词的上下文情感信息,更加适用于情感分类任务,能进一步提升ELMo的语义表征能力。(3)设计了一个简要的中文文本情感分类系统,并在该系统上进行了中文情感分类实验,实验结果证明了本模型在中文环境下的有效性,可为在真实的生产环境下落地应用提供参考,具备一定的理论和实际意义。
其他文献
压缩感知(compressed sensing,CS)理论可以远低于奈奎斯特采样频率对信号采样并实现高质量恢复信号,且在医学成像、信号处理、农业科学、遥感等诸多领域有着广泛的应用。但近些年来压缩感知的研究出现了瓶颈,传统的压缩感知重建算法往往需要大量迭代优化,具有较高的计算时间复杂度,且重建质量有些不如人意。因此研究高质量的重建方法迫在眉睫。近几年出现了基于深度学习的图像压缩感知重建方法,这类方法
由于全面的车辆无人化为时尚远,在未来相当长的一段时间内,道路交通会处于有人驾驶车辆与无人驾驶的智能车辆同时行驶的过程。在这个阶段,智能车辆在有多条车道且多辆周围车辆参与的道路上行驶时,会面临周围交通环境的复杂性与不确定性,在这种环境下进行换道动作时,面临着较大的碰撞风险,形成了对轨迹规划算法更高的安全性与可靠性要求。因此,针对结构化道路的多车交通环境,开展换道风险预测与轨迹规划方法研究,具有重要的
传统的实验试错法选择结晶溶剂需要消耗大量的人力物力,计算机辅助分子设计(CAMD)为结晶溶剂的选择提供了一种新思路。本文对有机物冷却结晶过程溶剂进行计算机辅助分子设计,形成与之对应的CAMD问题,研究和开发实用性高的CAMD方法,为有机物冷却结晶过程设计并选择出性能较优的溶剂。主要内容如下:首先,确定了溶剂的毒性、熔点、沸点、溶解性以及潜在回收率作为设计有机物冷却结晶过程溶剂的目标性质,并基于文献
电渗析是一种高效的脱盐技术,阴离子交换膜作为电渗析的核心,容易受到盐水中有机污染物的污染,目前已有的抗污膜存在抗污层不稳定的问题,制约了电渗析技术在处理高盐废水方面的应用。本论文为解决抗污阴离子交换膜的抗污层与膜本体连接不稳定的问题,研究了不同梯度交联原位互穿结构对改性阴离子交换膜电渗析和抗污性能的影响,初步探明了小分子污染物十二烷基苯磺酸钠(SDBS)以及鸭蛋清蛋白对阴离子交换膜的污染机制,得到
随着消能减震技术的发展,不同类型消能部件被广泛应用于结构抗震中,但这些消能部件在实际应用时仍存在一些问题。例如,现有钢支撑布置常常会占用与分割室内使用空间,对结构使用造成不利影响,同时也造成支撑在安装、维修和损坏更换上的困难。通过将支撑布置于结构外侧的方式,可以避免支撑对室内使用空间的影响和安装、维修上的麻烦,然而由于支撑外露,在外界温度作用下支撑中将产生附加内力,影响支撑正常使用,为此,本文研究
聚对苯二甲酸乙二醇(PET)瓶性能优良,价格合理,在饮料包装中得到广泛的应用,人们对其预制件——瓶坯的成型周期的关注度越来越高。瓶坯的冷却时间占其成型周期的70%以上,缩短冷却时间是提高瓶坯的生产效率的重要途径。通过对瓶坯的成型过程进行分析,增加瓶坯的导热面积可以提高瓶坯的冷却效率。本文提出并研究异形结构的PET瓶坯,并以常规倒锥形瓶坯为基础瓶坯设计异形结构瓶坯。在保证成型瓶性能满足使用要求的条件
气候问题的日渐严峻和化石能源的逐渐紧缺引起了人类广泛的关注,因此人们将焦点集中于可再生能源相关的研究上。可再生能源技术的发展会使电力系统中可再生能源能源比例升高,未来的城市配电网接入越来越多的可再生能源既是趋势,也是研究热点和挑战。另一方面,直流输电技术的迅速发展和配电网直流负荷的增多,也使城市配电网中的直流比例会越来越高。所以未来的城市配电网发展趋势应是含可再生能源的交直流混合配电网。城市配电网
建筑自然通风具有改善室内热舒适、提高室内空气质量和节约建筑能耗等作用,符合绿色和健康建筑等新时代的建筑发展理念。夏热冬暖地区风资源丰富,当地建筑十分注重自然通风。对该地区的办公建筑开展自然通风潜力及设计策略研究,对于办公建筑的健康、舒适和节能设计具有重要意义。自然通风潜力(Natural ventilation potential NVP)是有效辅助和优化建筑自然通风设计的手段。国内外相关研究丰富
随着3D打印技术的普及和快速发展,作为仿生制造平台的生物3D打印机逐渐被开发出来,用于制备具有生物结构和功能的构件。水凝胶由于具有良好的生物性能和机械性能而被作为生物3D打印的原材料广泛使用,但是现有的生物3D系统大多只能使用单一的材料进行制造,很难实现材料的空间组分连续变化分布。而生物体的组分大都不是均匀的,而是复杂的梯度变化,正是通过这种复杂的梯度设计,生物材料才具备了各向异性的性能增强以及复
目标跟踪是无人机应用研究的一项关键技术,倍受国内外研究人员的关注。基于无人机平台的目标跟踪系统通常使用机载相机采集图像,根据图像信息识别和定位目标,进而引导无人机追踪目标。然而,由于无人机所采集图像中场景的复杂性,以及无人机与目标之间存在相对运动,目标可能在所采集图像中丢失,引起跟踪任务失败。针对上述问题,本文提出了一种基于视觉感知的多无人机协同目标跟踪技术,一方面基于深度关联度量对视觉目标跟踪算