【摘 要】
:
学术社会网络是通过学术活动构建起来的网络,学者组成了网络中的各个节点,学者之间的合著关系构成了网络中的边。随着学术研究越来越快的发展,学术社会网络的规模也逐渐增大
论文部分内容阅读
学术社会网络是通过学术活动构建起来的网络,学者组成了网络中的各个节点,学者之间的合著关系构成了网络中的边。随着学术研究越来越快的发展,学术社会网络的规模也逐渐增大。在规模如此巨大的学术社会网络中搜索需要的信息,属于比较前沿的研究方向。目前,已经有很多学者对学术社会网络搜索进行了研究,也已经取得了阶段性的进展。将这种学术搜索付诸实践,论文审稿人评选就是其中一个典型的应用。它是在专家搜索的基础之上考虑审稿人与被审稿人之间的社会关系,从而搜索出符合条件的审稿人。为了解决学术社会网络搜索问题,本文提出一种基于关联度分析的学术社会网络搜索算法。本研究课题提出的算法主要内容包括:首先,需要计算候选节点与查询节点之间的内容相似度,这里采用的是短文本相似度的计算方法。为了使得计算出来的内容相似度更加全面,也更加符合实际情况,本文提出一种基于邻居节点语义关联度的短文本相似度计算方法,能解决之前短文本相似度计算方法存在的不足;其次,需要计算候选节点与查询节点之间的结构相似度,它是利用节点之间的最短路径来表示的,由于本文研究的网络图属于无向无权图,因此可以采用广度优先遍历的方法计算最短路径;然后,计算候选节点的权威度。综合上面的三个因子,构造候选节点与查询节点之间的关联度模型。最后,采用随机游走搜索策略进行节点的搜索,为了使得搜索过程更加快速准确,提出基于最短路径的随机游走搜索策略。这样,经过上述过程每个节点都会有一个分值,根据分值的高低为候选节点排序,选择指定数目的节点返回给用户。本文使用C-DBLP的数据集对搜索算法进行性能测试。实验结果表明,基于关联度分析的学术社会网络搜索算法在各项性能指标上比其他的搜索算法都有所提升,与之前的理论推断相符合。
其他文献
随着产品电子代码(EPC)以及物联网的概念的提出,RFID对人们生活的影响也越来越大。EPC给予每个产品一个唯一的身份标示,EPC标准体系的提出,使得RFID的开放式大规模应用具备了
分布估计算法(Estimation of distribution aigorithm,EDA)是一种基于概率模型的进化算法,它通过从当前群体中选取部分优质解作为产生新解的依据,利用概率分布模型分析这些解
拒绝服务攻击(Denial of Service,DoS)由于易实施、危害严重且难以防御,已成为目前互联网面临的最严重的威胁之一。而由其演进而来的分布式拒绝服务攻击(Distributed Denial of Se
近年来,灰色文献呈指数级增长趋势,涉及领域广泛,而且反映的是最前沿的信息,因此,各个国家,科研单位,高校都加强了对灰色文献的管理。就目前而言,灰色文献主要指学位论文、会
当今信息技术朝着电子化与网络化的趋势发展,人们的个人信息被南规模地收集与共享,隐私泄漏正日益成为一个重要的信息安全问题。在数据发布领域,隐私数据完全是对外公开的,任
在基于波分复用(Wavelength Division Multiplexing,WDM)技术的光网络中,单根光纤上承载着巨大的业务量,因此只要一个链路发生故障就会导致大量的数据业务丢失。在波分复用光
人们在日常生活中越发的关注网络安全问题,网络安全扫描的出现有助于我们更主动的管理网络,及时发现和修补网络中的漏洞。由于一个好的网络安全扫描系统需要提高扫描结果的准
人眼的状态检测和定位是人脸图像分析中最重要,也是最基本的问题之一,它不仅可以提高人脸识别的速度和检测的准确性,而且能够提高人脸识别算法的实时性。在脸部器官定位方面,由于
近年来,延迟容忍网络(DTN)是网络领域中一个热点研究问题,DTN和传统的网络有很多不同,例如,DTN经常面临长时间的中断转发(例如,星际网络通信)或间歇性连接所引起的高延迟。除
随着3G网络的商用部署和无线带宽的提高,无线网络的带宽将得到质的改善和提高。WAP、MMS、流媒体业务等极具潜力的移动数据业务将在今后几年取得巨大成功,数据业务将是3G时代