基于深度学习的情感分析研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:zjgzhufu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
情感分析是自然语言处理领域的基础任务之一,目的是分析文本表达的情感倾向。近年来,随着互联网和移动互联网的发展,各类社交平台和电商平台积累了大量用户产生的文本数据,分析这些文本数据对于提升社交平台和电商平台的服务质量有积极作用。相较于传统基于统计的情感分析模型,基于深度学习的模型广泛提高了情感分析模型的性能和鲁棒性。针对基于深度学习的情感分析的相关问题,主要工作包括以下几点:1.基于域适应的粗粒度情感分析,深度学习模型训练数据不足是一项基本问题,本文尝试通过域适应的方法解决这一问题。基于对抗训练的共享-私有模型在源域数据上训练共享特征提取器和特有特征提取器。其中共享特征提取器可以直接用于无标签的目标域。然后选择合适的源域通过对抗训练迁移特有特征信息到目标域。最终串联共享特征向量和特有特征向量两部分特征向量,完成粗粒度情感分析。相比之前的方法,通过域适应弥补了特有特征信息的损失,Amazon评论和FDU-MTL两个数据集上均取得了领先的结果。2.针对细粒度情感分析的分支方面级情感分析任务,本文采用双向LSTM分别编码上下文和方面词,引入位置权重向量,针对以往注意力机制计算时平均池化操作带来的信息损失,使用了词级别的注意力机制。在SemEval 2014的餐厅领域和笔记本领域,Twitter数据集等三个标准数据集上分别取得了79.9%,72.9%和71.0%的准确率,较所有基线模型均取得了明显提升。并且对测试集预测错误的样本做了总结和分析。3.针对方面的情感分析包括方面词实体抽取和方面词情感分析两个子任务,通常的研究独立处理这两个子任务。而从实际应用场景和任务相关性角度出发,同时处理两个子任务是更好的解决方案。本文尝试通过端到端的模型解决完整的方面级情感分析任务。采用了统一标注模式,将完整任务当作序列标注任务处理。使用预训练模型BERT编码上下文,针对不同的下游网络进行了实验。实验证明了基于序列标注的统一标注方案相较于流水线模型性能更好。基于BERT的模型采用微调的方式能获得显著的性能提升。由于序列标注任务的特点,BERT-SAN和BERT-TFM等基于自注意力机制的网络效果更好。
其他文献
<正>流行于民间乡镇的泰兴小戏班的传统木偶,旧称"三根棒"。简单地说,一根棒是木偶的主心棍,上端连接木偶的头部俗称"命棍";另两根棒就是操纵木偶两只手的杆子,称之为"手扦"
会议
背景对于人工膝关节置换术(Total Knee Replacement,TKR)来说,假体周围感染(Periprosthetic Infection,PJI)是最为灾难性的并发症,目前治疗TKA后PJI的方案有以下几种方法,包括单纯抗生素治疗,清创结合抗生素治疗,一期翻修术以及二期翻修术。二期关节翻修术作为治疗PJI的“金标准”,治疗效果最好,但其也使患者承受更大的痛苦以及更高的治疗费用。自固化硫
目的:总结肝硬化合并急性门静脉系统广泛血栓形成患者经皮肝门静脉穿刺置管溶栓治疗的护理经验,供同行参考。方法:回顾整理病历和护理记录,结合文献探讨。结果:在规范、准确
任何一个人的成功都离不开良好习惯,具备持之以恒的毅力和高尚精神品质,走好人生的每一步。幼儿园升小学是幼儿非常重要的过渡时期,因此教师要培养幼儿养成良好的习惯,才能更
当今社会以及整个世界相互之间的联系更加紧密,商家企业也正在不断探索新的营销方式,新媒体营销逐渐代替传统媒体营销备受各大商家青睐。本文通过介绍互联网思维的价值主张,
新能源的可持续发展问题近年来一直是全国"两会"关注的焦点。今年"两会"召开前夕,国家能源局发布了《国家能源科技"十二五"规划》,明确提出,未来我国能源发展将向绿色、多元、低碳
沁水县多年来蚕茧产量处于低而不稳的状态,1949年蚕茧产量为40万斤,1956至1979年,全县蚕茧产量一直徘徊在50万斤左右.主要原因是:第一,在相当长的一个时期内,片面强调以粮为
期刊
创新的价值产生于组织内、外部的信息沟通,充分的信息源获取与信息流通在创新的过程中至关重要。Vuori和Huy的研究表明,2014年宣布退出手机市场的诺基亚,正是由于糟糕的信息沟通。诺基亚高层的管理者无法及时获取市场反馈的真实信息,致使他们盲目乐观且创新无力,最终导致诺基亚在智能手机市场的浪潮中一败涂地。事实上,西尔斯、柯达、施乐这些曾经红极一时的优质企业,面临市场和技术突变时,即使管理良好、锐意提