基于图卷积的异构信息网络分类研究

来源 :广西大学 | 被引量 : 0次 | 上传用户:runzhong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分类问题是机器学习的一个重要分支,通过对已知数据的特征进行学习,预测未知数据的分类。分类预测模型在现实生活中有着广泛的应用:新闻文本分类、垃圾邮件过滤、银行客户评级、金融行业风险评估等。但是,随着互联网与移动通讯的高速发展,数据体量不断增大,数据之间的关系变得错综复杂。以往在研究分类问题时,研究学者们通常会假设数据之间是相互独立的,然而,面对如今复杂的数据关系,这样的假设也就不再适用。面对由复杂数据关系抽象而成的异构信息网络(Heterogeneous Information Network,HIN)数据,处理方式主要是:(1)忽略异构信息网络中存在的关系特征,利用传统机器学习分类模型进行研究;(2)忽略关系类型,利用邻居节点标签将关系转化为特征。无论是哪种处理方式,对数据之间的关系信息的利用都存在一定的信息损失。本文从直接利用关系特征进行图卷积特征提取的角度出发,研究了对异构信息网络关系的直接利用,基于GCN(Graph Convolutional Network)模型,分别提出了基于聚合信息的GCN-HIN分类模型——聚合图卷积(Graph Convolutional Network Aggregation,GCN-A)和基于残差信息的GCN-HIN分类模型——残差图卷积(Residual Graph Convolutional Network,Res GCN)。本文的主要内容如下:(1)提出了GCN-A算法。本文基于异构信息网络中研究节点之间复杂的关联关系,提出了GCN-A算法。该算法首先将异构信息网络依据元路径分割方法,分解成多个携带不同语义的同构网络结构,然后利用GCN依次对每一种语义的同构网络进行特征提取,再将各语义层提取出来的特征进行特征融合,最终输入进分类器进行分类学习。本文在3个标准异构信息网络数据集上的实验结果表明GCN-A算法优于对比的异构信息网络分类算法。(2)提出了ResGCN算法。本文基于异构信息网络中研究节点之间复杂的关联关系,以及GCN-A算法中存在受同构网络排序靠前的语义信息影响较大的缺点。提出了Res GCN算法。针对每一层语义特征,通过引入残差结果,强化研究节点自身特征的占比,最终达到优化分类预测结果的目的。本文在3个标准异构信息网络数据集上的实验结果表明Res GCN算法优于对比的异构信息网络分类算法,并对GCN-A算法有所改进。(3)算法应用分析。本文从恐怖事件知识库中提取出恐怖袭击事件数据集与恐怖分子关系数据集,并将其视作异构信息网络,将GCN-A与Res GCN算法应用在其中。实验结果表明本文提出的两种算法在上述两个数据集上的分类预测效果均优于其他异构信息网络分类算法。
其他文献
车辆检测一直是计算机视觉领域的热门研究方向,是推进智慧路侧停车管理系统、智能交通系统中无人驾驶辅助系统的基础。目前,随着深度学习在计算机视觉领域的不断发展,出现了许多检测性能表现优异的目标检测算法,因此本文采用基于深度学习的方法进行车辆检测。但是,对于车辆检测而言,由于检测场景复杂,比如:在无人驾驶辅助系统中对车辆检测的实时性要求很高;在智慧路侧停车管理系统中存在车辆目标密集且重叠度高的问题导致车
基层文物保护管理机构积极保护文物不仅有利于实现对传统文化的传承,而且可以在很大程度上保护文化多样性,促进人类文明的进一步发展。到目前为止,我国基层文物保护管理机构在文物保护工作中存在人力、物力投入较少,文物分布范围较广,对文物保护的宣传力度不足等问题,这在一定程度上阻碍了文物保护工作的发展。文章通过分析保护文物的意义以及基层文物保护管理机构保护文物时存在的问题,探索保护文物的方式、方法,以期提升我
期刊
在"磁场磁感线"的教学中渗透物理学史,设计围绕以史激思、促疑、体验、拓思等方式展开教学,再现物理学的历史成就,彰显科学思维方法在物理学发展中的作用,引领学生关注物理学史,参与物理探究过程,切实提升学生的科学思维能力。
本论文探讨了可溶性碳水化合物水平较高的甘蔗尾和甘蔗分别与粗蛋白质水平较高的桑叶和构树叶混合青贮的效果,两种原料的新鲜样质量混合比例分别为100%vs 0%、75%vs 25%、50%vs 50%、25%vs 75%、0%vs100%,青贮完成后分析青贮饲料的发酵品质及其常规营养成分变化规律,并分析有氧暴露后青贮发酵指标和主要微生物数量的变化。各项试验结果分述如下:试验一:甘蔗尾与桑叶混合青贮对其青
文章依据作业创新设计的原则,通过提供支架策略、改变条件问题策略、优化情境策略等,对如何设计出提升学生数学核心素养的作业进行了有益的探索。
本次试验旨在探明甘蔗尾凋萎及甘蔗尾或全株甘蔗茎叶比例对其青贮品质的影响。以期找出青贮甘蔗尾的最佳凋萎时间和甘蔗尾或全株甘蔗最适茎叶比,为调制优质全株甘蔗和甘蔗尾青贮提供理论依据,为广西开发利用糖蔗提供新路径。主要研究内容及结果如下:试验一:甘蔗尾凋萎0 h、24 h、48 h对其青贮品质的影响本试验主要研究甘蔗尾凋萎凋萎0 h(未凋萎)、凋萎24 h和凋萎48 h对其青贮品质的影响,每个处理4个重
深度学习是研究图像分类的重要手段之一。作为图像分类的重要子类任务,细粒度图像分类由于其研究对象是同一大类物体下的各个子类,有着众多应用场景,同时由于子类的类间相似度小与同一子类内差异大导致分类难度高,普通深度卷积神经网络难以在细粒度图像分类任务上取得优异的分类性能,本文针对这些问题构建了弱监督的细粒度图像分类模型,并在基准数据集上进行了实验,具体研究内容如下:(1)针对仅以单一卷积层进行特征提取而
随着社会的发展和生活水平的提高,人民群众对生活环境质量提出了更高的要求,而营造优越、舒适、美观的生活环境离不开园林植物的应用,因此对于美观且适应性强的园林植物的选择被提到紧迫的位置。本课题选择翠芦莉(Ruellia simplex)、花叶艳山姜(Alpinia zerumbet’Variegata’)、巴西鸢尾(Neomarica gracilis)等三种近年来在南方园林建设中常见的植物为研究对象
校长培训是中小学校长队伍建设的基础性工作,是提升中小学校长能力和专业水平的重要条件,NN市中小学校长能力提升培训项目质量管理的好坏直接影响着该市中小学校长队伍建设的长远发展。因此,本文以NN市中小学校长能力提升培训项目质量管理为研究对象,通过文献研究法、问卷调查法等方法,分析该项目质量管理方面存在的问题及原因,提出改进NN市中小学校长能力提升培训项目质量管理的对策。通过研究,本文发现第一期NN市中