科学引文网络分析及其应用研究

来源 :电子科技大学 | 被引量 : 7次 | 上传用户:shy19780928
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
引文网络分析以其巨大的研究和应用价值受到了人们的极大关注。现有研究大多都仅关注论文引用数据的静态分析,对论文引用趋势发展的实证分析及其预测研究还相对薄弱。本文详细研究了引文网络中论文被引的动态发展特性,提出三种预测论文未来被引趋势的算法,主要工作如下:1、提出一种基于引证多样性的论文潜在价值预测算法。现有的科研评价方法大多基于论文当前被引次数进行直接评估,忽略了论文引用呈动态发展的事实,存在一定的局限性。本文通过真实数据集上的实证分析,发现引文的领域多样性、时间多样性能在一定程度上反映论文未来被持续引用的潜力,由此我们改进已有方法,提出基于引证多样性的论文价值预测算法。实验结果表明,该方法能在不利用作者等文本信息的情况下,挖掘论文的潜在价值,并且预测准确性远优于原有算法。2、提出一种基于持续关注度衰减的论文动态排序算法。现有的对论文进行动态排序的方法大多存在预测精度较低或者计算复杂等问题。本文通过研究发现论文的年均引用次数与其未来的被引次数有很大的相关性,由此提出持续关注度的概念,进一步结合引文网络中的时间衰减效应设计论文动态排序算法。该方法计算过程简单,尤其适用于在海量文献中对论文进行快速排序。两个典型数据集上的实验结果表明,该算法在准确率上较现有算法提高30%。3、提出一种能预测论文未来被引次数的算法。现有的预测论文被引趋势的方法大都只能对其进行分类和排名,无法进行论文未来被引次数的具体数值预测。本文以同时期发表的论文为研究对象,剥离分析新增引用增长和自身质量两个因素对论文被引趋势的影响。进而提出一种能预测论文未来被引次数的具体数值的计算方法。实验结果表明,该方法不仅能对单篇论文的未来流行度进行较精确地数值预测,而且对系统中的论文排序也具有一定的长期预测能力。
其他文献
随着Internet/Web技术的快速普及和迅猛发展,WWW上的信息量不断增加,如何在这些信息中找到用户真正需要的内容,成为数据组织和Web相关领域专家学者关注的焦点。由于,因特网信
安全协议是用来保证电子商务等网络通信安全的重要工具。形式化方法是当今分析安全协议的一类主流方法,但是不同的形式化方法各有优劣,且应用形式化方法研究安全协议在理论和实
随着我国教育产业化的飞速发展,社会对教育水平和教学管理软硬件的要求日益提高,尤其是对学校的教学管理提出了更多的要求。为了及时响应教师和学生的需求,为师生提供相关服务,营
数据挖掘技术是目前解决数据丰富而知识贫乏的有效途径,是信息科学领域的前沿研究课题之一,已经广泛应用于科研、商业、金融和电信等领域。计算机信息技术特别是数据库在医疗机
随着信息技术的不断发展,计算机网络逐渐渗透到了国民经济的各个行业,计算机网络系统的安全已经成为经济社会发展不可忽视的一个方面。在众多的网络安全技术中,入侵检测技术由于
本文的撰写是建立在一个实际项目的基础之上,即辽宁国税综合数据平台系统。 税务信息化经过多年的建设积累了大量基层税收数据,但是数据零散,集中整合度低,不能适应税收决策和
Internet网络带宽的增加和多种DDoS攻击黑客工具的不断发布,使得DDoS攻击的实施越来越容易,DDoS攻击事件发生数量已成上升趋势,而SYNFlood攻击则成为各种DDoS攻击的首选手段。出
复杂场景下运动目标检测和跟踪技术成为视频处理分析领域中重要的研究热点之一,也是智能视频监控需要解决的核心技术之一,涉及到计算机视觉技术、图像处理技术、模式识别等多方
随着社会和科技的进步,计算机网络技术、通讯技术、视频处理技术得到了长足的发展,视频监控技术从早期的模拟视频监控技术发展到现在的网络化远程视频监控技术,视频监控系统
近年来随着网络技术的发展,网络用户数量在日益增长。用户在上网的过程中会产生用户行为数据,这其中包括浏览网页,网络购物,观看视频等一系列的信息。数以亿计的用户产生的数