基于异构网络的学术实体权威度评估方法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:zjr_1988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的飞速发展,人们的生活越来越依赖互联网,网络成为人们探讨问题、交流信息的主要平台。同样,学术界的交流重心也由线下转移到了线上,越来越多的研究成果以网络为载体进行传播和共享。然而,网络中学术资源的高速累积使得人们很难快速、准确地找出高质量多价值的需求学术文献和高技术水平的研究者与研究单位。对科技文献、学者和研究机构等学术实体的科技实力和权威度进行研究与评估具有很大的现实意义。  在异构混合网络链接结构基础上,针对学术文献、学者和机构三类学术实体的权威度进行了研究。利用学术文献引用关系、学者合著关系等三类实体间的六种关系建立了异构混合网络,根据该网络,借鉴PageRank和Co-ranking算法思想,建立了混合随机游走模型Co-AcademicRank算法,计算学术文献、学者和机构的pagerank值。学术文献实体的权威度评估问题,除关系网络外,还从学术文献来源(学者、机构和期刊)和学术文献自身有效特征两方面考虑,构建学术文献综合权威度评估模型。同时,针对模型在海量数据情况下性能急速下降的问题,基于MapReduce编程模式,对模型核心部分Co-AcademicRank算法进行了分布式化实现。  在期刊论文集上进行实验,从效果和性能两个方面评估了算法的优劣。对比经典PageRank和Co-ranking算法,分析发现本研究较前两者有更好的评估效果,并且在甄别高权威度信息方面有明显的优势,证明了本模型的有效性和优越性。同时,比较单机环境和Hadoop平台算法的运行时间,发现在大规模数据环境下,分布式算法的运行时间远远小于单机算法,验证了Co-AcademicRank分布式算法的高效性和性能稳定性。
其他文献
互联网数据根据是否能被搜索引擎所索引分为浅层网络和深层网络。深层网络相比浅层网络具有更大的数据量和更高的质量,高效的定位深层网络数据源是挖掘隐藏在深层网络背后信息
本文分析了传统企业应用集成存在的不足,深入研究了Web Service技术的体系结构和关键技术,分析了Web Service技术在应用集成方面的优势,提出了一种基于Web Service的应用集成
粗糙集理论是20世纪80年代初由波兰数学家PaWlak Z.首先提出的一种新型的处理模糊和不确定知识的数学工具,其基本思想是在保持分类能力不变的前提下,通过知识约简,导出概念的分类
本文对基于XML的异构数据库数据交换在财税库行系统的实现进行了研究。文章针对财政、税务、国库、商业银行等各部门信息系统采用的异构数据库,在目前异构数据库数据交换的主
随着嵌入式系统的不断发展,EVD、PMP、智能手机、PDA、数字电视和IPTV等消费电子类产品越来越多地受到人们的亲睐。其中便携式媒体播放器(PMP)是最近非常火热的嵌入式消费类
信息隐藏技术作为信息安全领域的一个研究热点,已引起很多专家和学者的关注,近几年取得了很大进展。信息隐藏技术主要包括两个方面:信息伪装和数字水印。网络的发展使信息的传递
随着Web网站规模的逐渐扩大,Web日志数据日益膨胀,对网站管理的任务变得越来越艰巨。如何从大量Web日志数据中提取出潜在有用的信息和知识,以便网站管理人员可以据此优化网站的
视频监控技术在工业、商业和军事等领域都有非常广泛的用途。近几年来,随着网络通信技术、多媒体技术和嵌入式技术的飞速发展,视频监控技术也取得了质的飞跃,从早期的模拟监控时
Peertopeer网络技术是近年来网络研究的热点问题之一。自从Napster软件出现以来,P2P(peert0peer)技术就开始在文件交换、协同工作、对等计算和搜索引擎等方面得到了大量的应用
近些年来,我国电子商务的飞速发展,不仅改变了人们的生活方式,也对传统的物流业造成冲击,物流问题已经成为企业发展的瓶颈,物流调度对提高物流系统运作的效率至关重要。目前物流调