基于知识增强的图卷积神经网络的文本分类

来源 :浙江大学学报(工学版 | 被引量 : 0次 | 上传用户:lockin025
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对文本分类问题,提出新的基于知识增强的图卷积神经网络(KEGCN)分类模型. KEGCN模型在整个文本集上构建了一个包含单词节点、文档节点、外部实体节点的文本图,不同类型节点之间使用不同的相似性计算方法;在文本图构建完成后将其输入到2层图卷积网络中学习节点的表示并进行分类. KEGCN模型引入外部知识进行构图,捕获长距离不连续的全局语义信息,是第1个将知识信息引入图卷积网络进行分类任务的工作.在4个大规模真实数据集20NG、OHSUMED、R52、R8上进行文本分类实验,结果表明,KEGCN模型的分类准确率优于所有的基线模型.将知识信息融入图卷积神经网络有利于学习到更精准的文本表示,提高文本分类的准确率.
其他文献
新华社北京9月16日电吴蓉瑾,女,汉族,1974年生,中共党员,上海市黄浦区卢湾一中心小学校长、教师。她传承红色基因、培育红色传人,培养近千名小学生党史讲解员,在学生心中播撒理想信念的种子。她扎根基础教育、潜心教书育人,不断创新德育方法手段,真情守护学生身心健康,有力促进了学生们德智体美劳全面发展。她推动教育公平、促进均衡发展,以实际行动推进优质教育资源均等化,在努力办好人民满意的教育上作出
期刊
学位
[目的]使用预训练语言模型进行长文本的分类的过程中,目前受到预训练语言模型输入长度的限制而无法有效利用长文本中的所有文本信息。[方法]为在不改变预训练语言模型的条件下充分获取长文本内容特征,设计了依据自然文本中存在的标点符号进行分句并按次序输入预训练语言模型的分类模型。提出了平均池化法与注意力机制加权法对分类特征向量进行压缩编码并在多个预训练语言模型上进行实验。[结果]相比于直接截断文本内容,使用
学位
全球价值链分工体系面临重构和调整,中国制造业参与全球价值链分工被赋予新的内涵。文章从中间产品和增加值贸易视角,基于WIOD数据库和WWZ模型对中国制造业参与全球价值链分工地位进行考察。结果表明:2008年以来,制造业国内增加值DVA和RDV比重上升,国外增加值FVA比重下降,制造业在全球价值链上多环节生产的能力不断提升;2004—2018年中国制造业在全球价值链的位置度缓慢提升,全球价值链参与度呈
作为展现历史发展进程、文化教育的重要载体,博物馆的发展随着人们日益增长的文化需求而受到越来越多的重视,同时国家出台了各项政策来支持文创产业的发展,博物馆文创产业也因此变得举足轻重。文章分析了博物馆对于文创产品的影响,提出博物馆文创发展的新思路,以增加博物馆交互性的方式和游客参与文创产品制作、表现文化传承的意义,使博物馆文创能够积极得应对未来变化的市场。
期刊
针对驾驶员愤怒驾驶引发的道路交通安全问题,提出一种基于AdaBoost与改进卷积神经网络(convolutional neural networks, CNN)的驾驶员愤怒情绪识别模型。利用AdaBoost算法检测驾驶员人脸并采集面部表情数据,建立基于驾驶员情绪的表情数据集。针对CNN中LeNet模型的不足,提出改进方案,搭建改进LeNet模型。利用数据集对LeNet模型和改进LeNet模型进行训
学位
对于未来,每个人或多或少都会有所憧憬。而我们憧憬的未来,需要当下的自己做好规划,不断奋斗,才能实现。规划,作为行动指南,其重要性不言而喻。那么,如何规划?根据职业生涯发展理论,一个人的职业生涯可分为成长期、探索期、建立期、维持期和衰退期。中等教育阶段是职业生涯探索期和建立期的衔接阶段,也是一个人进行生涯规划的关键期。因此,在这一阶段,除了学习文化课知识、专业技能外,同学们还应有意
期刊