基于锚点的快速无监督图嵌入

来源 :计算机科学 | 被引量 : 0次 | 上传用户:hopkings
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图嵌入降维算法由于其有效性被广泛应用.传统图嵌入算法构造K-Nearest Neighbors(K-NN)图的计算复杂度至少为O(n2 d),其中n为样本数,d为样本维度.在数据量大的情况下,构造K-NN图将非常耗时,因为其计算复杂度与样本数的平方成正比,这将限制图嵌入算法在大规模数据集上的应用.为降低构图过程的计算复杂度,提出一种基于锚点的快速无监督图嵌入算法(Fast Unsupervised Graph Embedding Based on Anchors,FUGE).该算法首先从数据集中选取锚点(代表点),然后构造数据点-锚点相似度图,最后执行图嵌入分析.由于锚点数量远小于数据量,所提方法能有效地降低构图过程的计算复杂度;不同于使用核函数来构造相似度图,该算法直接通过数据点的近邻信息来学习数据点-锚点的相似度图,这进一步加快了构图过程.整个算法的计算复杂度为O(nd2+nmd),其中m为锚点数.在基准数据集上的大量实验证明了所提算法的有效性和高效性.
其他文献
针对现有地铁线路上的接触轨检测方法存在检测效率低、检测项目少等问题,本文设计了一套轨道交通接触轨综合检测系统,实现接触轨表面缺陷(疤痕、擦伤等)和空间形位参数的自动化检测.首先,利用安装在系统上的视觉模块拍摄接触轨表面图像,并使用改进的YOLOv3网络实现接触轨表面缺陷的实时检测;其次,根据安装在系统上的2D数字激光传感器、倾角传感器和位移传感器采集来的数据,计算得到接触轨空间形位参数.实验结果表明,接触轨表面缺陷检测精确率和召回率达到90.21%和89.64%,检测速度达到0.015 s/f,接触轨拉出
链路预测是网络科学的一个重要研究分支,旨在推断网络中节点对间存在连边的可能性.现实生活中很多事物关系都能够通过网络科学进行描述,很多实际问题都可以转化为链路预测问题.节点无特征网络链路预测算法可向有向网络、加权网络、时序网络等更复杂的网络推广.但现有的链路预测算法面临着网络结构信息挖掘不够深入、特征提取过程受人为主观意识影响、算法很难迁移到其他网络中、算法复杂度过高而无法在大型真实工业网络中应用等诸多问题.针对上述问题,文中基于图注意力网络的基本结构,采用图嵌入表示技术采集节点特征,类比神经图灵机中的内存
随着人机交互在计算机辅助领域的快速发展,脑电信号已成为情绪识别的主要手段.与此同时,图网络因其对拓扑结构数据的优秀表征能力,逐渐受到研究者们的广泛关注.为进一步提升图网络对多通道脑电信号的表征性能,文中结合脑电信号的稀疏性、不频繁性等多种特性,提出了一种基于时空自适应图卷积神经网络的脑电情绪识别方法(Self-Adaptive Brain Graph Convolutional Network with Spatiotemporal Attention,SABGCN-ST).该方法通过引入时空注意力机制解
随着网络技术的飞速发展,IPv4网络已远远不能够满足用户的需求,因此,IPv6网络技术的投入使用变得越来越广泛.而对于在校园网中IPv6网络运用最多的是用户的认证系统,这种方法解决了 IPv4网络的地址空间的短缺及安全方面的问题[J].通过介绍IPv6与IPv4网络认证之间的比较,简要分析了两者的利弊,并探讨了改进的思路方法.
针对关系型网络的社区发现问题,考虑节点间相互作用的强弱程度和信息渗流机理,创新性地提出了一种基于边权重和连通分支(Edge Weight and Connected Component,EWCC)的社区发现算法.为了验证算法的有效性,首先,构建了5种具有相互作用的双层网络模型,通过分析层间节点作用的强弱程度对网络拓扑结构的影响,确定了5种双层网络模型下生成的30个数据集;其次,选用真实数据集分别与GN算法和KL算法在模块度、算法复杂度和社区划分数目评价准则上进行了对比,实验结果表明EWCC算法的准确性较高
政务大数据是新时期数字政府建设的核心资产,对推动政府功能服务升级和经济、社会创新发展具有重要意义.但在复杂的网络流通环境下,为了保障政务大数据的合理、有序和可靠利用,其数据安全防护能力建设不容忽视.在技术层面,政务大数据安全防护涉及网络安全(Network Security)、平台安全(Platform Security)和应用安全(Application Security)等核心要素;在管理层面,政务大数据安全防护则需要重点关注人员素养(Personnel Quality)和制度质量(Instituti
在众包平台上,不同类型的用户在参与意愿、工作动机、业务能力等方面具有多样性和差异性的特征,在平台上产生的价值也不同.基于用户价值度量对用户进行细分,是更好地洞察用户价值和需求、对用户进行个性化和精细化管理的关键.同时,选择众包用户价值衡量维度也是目前需要解决的问题.因此,该研究首先基于RFM模型并结合众包平台及众包用户的特性,将用户信用纳入用户价值模型,提出并构建了众包用户价值衡量模型RFMC(Recency,Frequency,Monetary,Credit);然后,结合“一品威客”平台获取所需的实验数
现在由于互联网的广泛应用和迅猛发展,Web应用的使用越来越广泛,面临的问题就是攻击者可以使用SQL注入漏洞获取到服务器的库名、表名、字段名,进而来盗取数据库中用户名和密码等数据.攻击者通过非法手段来获取数据库的权限,可以对Web应用程序进行删改等操作.SQL注入漏洞使Web应用程序安全存在巨大的安全隐患,对整个数据库也有严重的影响.
为了提高集群网络中全序数据传输性能,本文提出了一种新颖的传输框架——TOC,该框架由TOC-RE策略和TOC-Re策略两部分组成.首先,提出了层次化时间戳聚合机制,使TOC-RE策略能够提供尽力而为的服务;其次,设计了丢包处理机制和故障恢复机制,使TOC-Re策略实现可靠的传输服务.采用测试平台评估TOC的性能,结果表明TOC以较低的开销实现了高吞吐量和低延迟,具有一定的可扩展性.
学术文献中蕴含着丰富的引用信息,文献引用是科研评价和文献计量领域的主要分析对象和研究热点.相比基于数学和统计学的定量分析方法,利用可视化方法既可以实现引用信息时序、层次结构的直观呈现,也可以实现复杂引用网络的交互式挖掘,对科研评价改革和文献计量方法创新具有重要意义.文中首先介绍了近年来国内外学术引用信息分析的相关研究,总结了学术引用信息可视化的一般框架;然后根据实体评价和文献计量两类应用场景对可视化方法进行分类,详细阐述了可视化方法在两类应用场景中的研究现状和优缺点;最后指出了学术引用信息可视化面临的挑战