非序列文本分类模型显著性特征可视化方法的研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:wade68
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在实际的应用中,无论是科研人员还是用户,都希望能够了解模型做出判断的依据和过程,以信任模型的决策结果。当模型做出了错误判断后,了解模型判断错误的原因,也对模型的进一步改进和提升有很大帮助。人们在不断应用和创新各种模型并解决了一个又一个问题的同时,机器学习模型缺乏可解释性的矛盾日益尖锐起来。在一些对模型和精度要求较高的领域如医疗专家系统、虹膜身份识别、工业互联网等,可解释性的缺失会给任务带来严重威胁,更有甚者可以通过制造对抗数据对模型进行进攻,使模型的决策失效或做出错误决策。因此,了解模型的决策依据尤为重要。实际上,对深度学习的解释是一项很困难的工作。这种端到端的黑盒模型将学习到的知识保存在了网络的参数矩阵中,并直接应用于决策过程。因此,人们无法准确的分辨出模型决策所采用的知识是什么。目前,人们还没有对可解释性形成一个统一的定义,更缺乏对解释方法性能的评价方法。随着深度学习技术的发展,为了适应更复杂的任务需要或进一步提升性能,越来越多结构复杂的模型被提出,越来越多复杂的技术被应用在模型结构中,这对模型的可解释性研究造成了更大的困难。相较于侧重感知的计算机视觉领域,自然语言中相同的词语在不同的语境环境和情况下,所表达的意思都可能不同,不同单词间的组合可能表达出不同的涵义,因此需要模型去认知数据。从这种层面上来说,提取文本数据中决定模型决策的显著性特征更加困难。对文本领域的深度学习模型的可解释性研究一直是该领域的一个难题。随着注意力机制的广泛应用,深度学习模型在各项任务上的性能有了显著的提升。注意力机制模拟了人在认知事物过程中的方式,计算出模型应该对样本集中注意力的范围并给予高权重,而对于无关的部分则分配较低的权重。这种方式在提升了模型性能的同时,也为模型的可解释性研究带来了新的方法。通过基于注意力机制的显著性特征提取方法对模型进行可解释性研究已经是很普遍的做法。但相应的,注意力机制在显著性特征可视化方面有着无法弥补的缺点。首先,在普遍情况下,注意力机制被应用于将文本以序列形式输入的模型中,例如RNN及其变形的LSTM和GRU,以及只依赖self-attention进行特征抽取的Transformer。因此,以注意力机制进行显著性特征可视化也只能应用于这些模型中。但是,很多工业和学术界常用的文本分类模型例如fastText、CNN等,在模型的结构中,文本位置信息丢失,无法或只能有限的应用注意力机制,这种情况下就无法有效的进行解释。其次,这种通过引用模块对模型进行解释的方法,对所引用的模块,即注意力模块,仍然无法解释。最后,经过训练的注意力参数仍有可能存在误差,相应的,进行显著性解释也会出现误差。本文基于自然语言处理领域中的文本分类任务,针对fastText与CNN这种非序列的模型提出了一种新的显著性特征可视化方法。同时,本文对应用了注意力机制的LSTM和Transformer模型进行了注意力权重参数提取,分别进行了基于注意力机制的可视化方法研究。最后,本文设计了可解释性方法性能评价方法,并对以上四种不同的方法进行了有效性评估,在证明了本文提出的方法有效的同时,分析了基于注意力机制的提取方法的缺陷以及模型做出错误判断的原因。
其他文献
近些年,商品推荐模型越来越多的融入了用户个人相关信息,这些信息有效的增强了用户与商品之间的粘合度,提高了推荐的准确度。基于用户信息的个性化推荐算法已经成为重点研究方向,针对于不同类别的用户,推荐结果也呈现多样性,其中基于地域划分和情感分析的推荐方法逐渐体现出越来越重要的地位。地理区域的不同影响着用户兴趣的变化。同时,时间因素对于评论情感的极性的变化有着一定的影响,进而影响着用户的抉择,一些研究没有
自2013年“一带一路”倡议全面实施以来,不仅得到了国际社会的高度关注和强烈共鸣,同时也获得了沿线国家的认可与支持。至此,中国与沿线各个国家的在投资合作方面迎来一个新
铝合金作为一种优良的铸造材料被广泛应用于航空航天、铁路机车等领域。相比于传统的钢铁铸造材料,其具有比强度高、耐腐蚀等优点。不仅在节省能源、保护环境等方面有着重要
商标延伸注册问题产生于商标申请人利用品牌延伸策略扩张经营之需求与我国现行商标注册制度之间的冲突,主要关涉商标异议程序中,商标申请人能否依据其在先基础商标与延伸商标
随着国内车用商品汽油标准对烯烃含量的限制越发严格,以及人们对空气污染的关注,降低汽油中烯烃含量,改善汽油燃烧性能并提高汽油辛烷值具有现实意义。本文主要研究磁基铑催
近年来,随着科技与通讯业的疾速发展以及大屏智能手机的流行,人们的道德判断不再局限于发生在传统的纸质呈现载体下,更多发生在手机屏幕这种新的呈现载体下。呈现载体的改变是否影响人们的道德判断?有研究指出,人们经常在手机上快速浏览碎片化的新闻讯息,表现为一种“浅阅读”;且人们在手机上做决策时会体验到“窄化效应”。这些因素综合起来会引起人们更抽象、更高层次的心理表征,从而对道德情境的判断也会更加严苛,即对道
学业自我妨碍是指学生在学业成就情境中,为使自我价值不受损,而预先采取的任何能够增大将失败原因外在化的策略方式。高二阶段是学生学业自我妨碍的高发期,大量研究发现,长期
相比于一元纯金属纳米粒子,许多双金属纳米粒子会具备更加优异的物理和化学性能。已有大量实验和理论研究表明:很多双金属纳米粒子因为元素之间表面能和原子半径的不同而优先
在对模态问题的研究中,卡尔纳普、辛迪卡将可能世界解释为语句的极大一致集合。而大卫·刘易斯认为,“语句的极大一致集”这一表述本身就包含着模态,可能世界不可能是句子的集合。基于反事实条件句的分析,大卫·刘易斯对可能世界做了实体解释,创建了他的可能世界理论。大卫·刘易认为,可能世界是实体的存在,它们是由时空相连的部分构成的。接着,他分析了可能世界的孤立性、具体性、现实性和充裕性特征。面对哲学家们提出的诘
我国《国家赔偿法》中规定了行政追偿制度,但由于立法过于原则和笼统,导致行政追偿制度在实践中的未能发挥其应有的作用,法律规定形同虚设。本文从行政追偿制度本身出发,将行