【摘 要】
:
随着信息化时代的到来,全球学术研究活动快速发展,学术文献的发表数量日益增长。为了解决海量学术文献难以管理这一难题,以互联网技术为核心的大规模文献数据库、学术检索平台等应运而生,极大地改变了科研学者对文献数据的检索方式。然而,来源于不同文献检索系统的作者存在同名现象,使得许多同名作者的学术文献无法进行正确的归属,降低了学术检索的准确性。目前大量学者提出了基于机器学习或基于图的作者同名消歧算法,但存在
论文部分内容阅读
随着信息化时代的到来,全球学术研究活动快速发展,学术文献的发表数量日益增长。为了解决海量学术文献难以管理这一难题,以互联网技术为核心的大规模文献数据库、学术检索平台等应运而生,极大地改变了科研学者对文献数据的检索方式。然而,来源于不同文献检索系统的作者存在同名现象,使得许多同名作者的学术文献无法进行正确的归属,降低了学术检索的准确性。目前大量学者提出了基于机器学习或基于图的作者同名消歧算法,但存在特征信息未被充分挖掘、忽略全局结构信息等问题。因此,本文从充分利用特征信息和考虑全局结构信息的角度出发,对科技文献数据库中作者同名消歧问题展开深入研究。主要工作如下:(1)提出一种基于合作者特征的作者同名消歧方法。首先,考虑到文献作者信息的隐私性,本文使用高阶合作关系构建同构学术网络。其次,为了获取网络中的全局结构信息,提出一种学术网络中基于全局节点共现的网络表示学习方法。该方法可以学习每篇学术文献的低维向量表示。然后,使用一种基于密度的聚类算法将文献分成若干个簇,使得每个簇中的学术文献由同一个作者所写。最后,两个真实的文献数据集上的实验结果表明,本文提出的方法在消歧性能上优于对比方法。(2)提出一种基于异构学术网络和语义特征的作者同名消歧方法。首先,针对学术文献数据的异构性,本文使用文献的实体特征构建异构学术网络。其次,考虑到学术文献中丰富的语义特征,提出将语义特征用于文献节点向量的初始化。然后,使用一种基于成对排序的异构网络表示学习方法获取文献节点的特征表示。接着对待消歧的作者姓名进行层次聚类分析。最后,一个真实的AMiner数据集上的实验结果表明,本文提出的方法可以获得较好的消歧效果。
其他文献
行人重识别任务主要是给定一张行人图像,在一个大型的图片库中去匹配到该行人的另一张图像。近些年来不断涌出的基于深度网络的行人重识别算法在很多大型数据集上都持续刷新记录。由于现实情况下可能会存在各种遮挡物体,很多用于解决行人重识别任务的模型并不能很好地适用于存在很多遮挡的数据。因此,本文研究了在遮挡情况下的行人重识别,根据对遮挡数据的不同处理,将分为局部行人重识别和遮挡行人重识别两个子任务分别去研究。
近年来,随着移动通信技术快速发展,圆极化天线以其独有的特性被广泛用于各种各样的无线通信系统中。天线作为通信系统的不可缺少的一环,对其性能的要求也越来越高,如要求天线要具有尺寸小,宽频带,高增益,方向图良好,低成本等特性。在一些空间有限的无线通信设备中,也通常需要天线具有低剖面的结构特性,但同时具备宽带和低剖面的特性还有待研究。因此,本文主要对宽频带和低剖面这两个特性设计了三种圆极化天线,主要内容为
大规模多输入多输出(Massive Multiple Input Multiple Output,Massive MIMO)技术作为第五代移动通信系统的关键技术之一,相对于传统MIMO技术来说,增加了更多的天线数量,在系统容量、频谱效率、数据传输速率和传输可靠性等方面显著提升了系统性能。但是随着基站天线数和用户数的增加,Massive MIMO信号检测过程的计算复杂度较高,难以实现,是研究的难点问
随着大数据时代的到来,人们对自动驾驶、计算机视觉、语音识别等数据密集型应用越加的重视。现如今,几乎所有先进的计算平台都是基于著名的冯·诺依曼架构,由于其计算和数据存储分开的特性,在处理数据时需要在计算模块和存储模块之间进行频繁的数据传输,从而造成了“内存墙”的问题。为了解决“内存墙”的问题,很多学者提出了“存算一体化”的概念,即将部分计算模式嵌入到内存中,从而减少处理器和存储模块之间的数据传输。静
随着数据分析技术的迅速发展和智能终端设备的广泛应用,数据聚合成为各个领域中的一项重要技术。在面向边缘计算的数据聚合中,边缘服务器收集和聚合来自终端设备的感知数据,以提供智能计算和实时控制等服务,并且将聚合结果上传给云服务器,从而执行全局的数据分析。考虑到感知数据可能涉及终端用户的隐私信息,面向边缘计算的隐私保护数据聚合方案被相继提出。隐私保护原始数据聚合支持服务器收集原始感知数据,从而可以计算任意
检索任务一直都是学术界和工业界关注的热点,最初的工作主要集中在单模态检索上,例如用图像检索与之相似的图像。但是现如今互联网的发展速度非常快,人们频繁地使用手机中的各类软件,生产出大规模的多模态数据,例如图片,文字,视频和语音等等,以往的单模态检索技术面对人们多样化的检索需求开始变的逐渐乏力,例如人们想要通过一幅图像搜索出与之相关的视频片段或者文本描述。因此为了更好地满足人们的需求,同时更好地利用这
车辆在行驶过程中会发送包含位置的消息从而达成以下目的:告知周边车辆自己的实时位置,减少交通事故的发生;向基于位置服务的服务器请求新闻资讯、社交、娱乐等网络服务,改善驾驶体验。而由于车联网具有大规模的网络结构和开放的无线信道,车辆位置隐私信息每时每刻都暴露在网络中,如果这些隐私信息不能得到保护,用户的隐私将会泄露。传统的位置隐私保护方案提出使用假名来保护车辆的位置隐私,然而简单地假名更换并不能满足车
全息视频显示的核心器件是空间光调制器(Spatial Light Modulator,SLM),现有的SLM设计都是基于经典的光学原理,无法满足全息视频显示所需的大空间带宽积及大视场角等需求,因此我们需要借助最新发展的等离激元学和微纳技术来解决全息视频显示所面临的核心问题。但目前的微纳光场调控器件大多集中在无源,而有源微纳SLM器件的研究及技术开发仍然面临很大的挑战。区别于现有的利用光程差原理的硅
面对大幅度提高5G频谱效率的要求,一种新的多址接入技术被提出,即非正交多址接入(NOMA,Non Othogonal Multiple Access)。在3G时代使用的码分多址(CDMA,Code Division Multiple Access)技术中,多个用户共享一个信道资源,用户的地址码具有一定的相关性,这就导致解码时,用户之间相互干扰。而在正交多址(OMA,Othogonal Multip
与传统干涉测量方式相比,激光回馈干涉法凭借灵敏度高、结构紧凑、无需准直等优势,成为了检测微弱信号的计量学方法之一。但现有激光回馈干涉系统中低频噪声严重限制了该技术的应用场合。因此,我们提出一种基于移频技术的全光纤结构的激光回馈干涉位移传感系统,通过结合声光调制技术有效解决低频噪声对待测信号的干扰,成功实现了非合作目标几十皮米级的微小位移传感。同时,通过建立激光回馈移频干涉位移传感系统中探测灵敏度的