基于注意力机制的短文本分类

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:cloudyang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
短文本分类是一种基于长度较短文本学习语义表征并用于分类的任务,其应用场景包括社交媒体上用户的实时评论,对于商品/作品的评价等,这些文本通常具有口语化的特点。目前,应用于短文本分类任务的一个有效方法是深度神经网络。具体地讲,这类方法旨在学习得到一个文本语义表征,表征的质量决定了方法的有效性,但短文本自身的语义稀疏问题使得学习一个高质量的完整的语义表征是极其困难的。为此,本文提出基于注意力机制的联合表征学习模型——AJRLN,该模型根据短文本场景特点设计了多模块语义提取机制,引入了正则约束项促使多模块结构分别提取具有判别性的文本语义特征,再应用注意力机制进行联合学习,得到包含完整语义的高质量表征。然而,AJRLN模型是基于传统词向量方法与神经网络结构设计的,其中前者会使模型受限于文本的“一词多义”情况,而后者则可能导致网络结构依赖性问题。在此基础上,本文进一步提出了基于BERT语言模型的句子表征学习网络——BSRLN,该模型基于预训练BERT与多头自注意力机制的联合,取代了AJRLN模型中传统的词向量方法与神经网络结构,充分利用了上下文词向量信息并进一步提取语义信息内部的多路相关关系加以融合,从而提升分类性能。本文在真实短文本数据集上进行了一系列实验来验证AJRLN模型与BSRLN模型的有效性。实验结果表明本文所提出的模型明显优于传统的深层神经网络模型,结合注意力机制设计思想的语义提取框架可以有效提升短文本分类任务中的表征提取质量,具有较高的应用价值。
其他文献
随着互联网技术的发展和智能设备的发明,数字图像的获取和传输越来越容易。网络社交平台的推广使得线上图像分享成为一种潮流,图像传输和存储的安全问题也成为了人们关注的重
“学习提示”是2019年投入使用的统编高中语文必修教材课后的一个栏目,由教材编者撰写,取代了以往教材中的课后习题,是这套教材的一大创新。它体现编写意图,揭示课文实质、提出学习路径等,对学生学习课文和教师开展教学有很大参考价值。本文系统梳理读写单元内附于课文后的所有“学习提示”,了解其内容及其分类,考察“学习提示”与教材中的单元导语、单元学习任务,以及人民教育出版社出版的统编高中语文必修教材《教师教
2019年2月,国务院发布了《全国职业教育改革实施方案》,首次明确了“职业教育和普通教育是两种不同的教育类型,具有同等重要的地位”。这是对我国职业教育战略地位认识的深化
弱监督的细粒度图像识别仅使用图像级别标签来区分每个大类中不同的数百个子类。由于具有类内差异大类间差异小的特点,细粒度图像识别是一项极富挑战性的任务,目前主流方法主
互联网作为人们获取信息的主要途径,在给人们生活带来便利的同时,也使得人们不得不面临信息过载的问题。由于推荐系统能有效缓解信息过载,在互联网公司中应用非常广泛,其中,
《普通高中英语课程标准(2017年版)》提出了发展学生听、说、读、写、看等语言能力的要求与建议,并说明了高中英语写作教学应注重对学生策略能力的培养。本文基于认知过程的
Servi和Finn提出的工作休假策略是排队论研究的热点问题,它主要描述了这样一种情况:即服务员在休假期间虽然不会停止工作,但是服务的速率比较低。也就是说,在休假期间,系统仍留下部分服务员继续工作,其余服务员可以进行休假或者做其他工作。与经典休假排队相比,工作休假可以更有效地保证系统的运行,使得系统的损耗和负载尽可能降到最低,即在系统中,当主要工作相对较少时,可从事其他辅助工作。如果在工作休假期没
近年来,随着污水排放标准的逐渐提高,新型生物脱氮技术成为水环境处理领域研究热点。如何利用氨氧化菌(AOB)和亚硝酸盐氧化菌(NOB)的不同代谢特征,实现对NOB的抑制作用,完成生物处理系统内亚硝酸盐不同程度的积累,往往是新型生物脱氮工艺开发的核心问题。稳定实现生物处理系统的亚硝酸累积,受制于溶解氧(DO)、游离氨(FA)、温度(T)等因素,这些因素之间相互影响、相互制约。本研究利用序批式反应器(S
青少年是正处于学习时代的主要人群,当代在学生时代就已经接触智能终端的人群,在日常的社会生活中比较熟悉利用智能终端来进行学习、支付以及新消息的接收。比起成年人,青少
脱氧糖是一种重要的糖类化合物,在现代药物中经常出现它的身影。由于脱氧糖在医药领域有着巨大的潜力,它受到了人们的广泛关注。目前合成脱氧糖的主流方法都存在一些缺陷。因此寻找高效,绿色的合成脱氧糖的方法具有重要研究意义。本文以探索合成脱氧糖的新型方法为研究内容,主要研究结果如下:一、在本课题组之前的光照脱巯基反应基础上,对其改进得到了一种绿色,高效的合成方法。使用含硫乙酰基的糖苷作为反应原料,DMF作为