【摘 要】
:
科技文献的数量呈爆炸性增加,科研知识的演变和进化更加迅捷,难以快速掌握。如何从大量科技文献中快速分辨出具有较高阅读价值的文献成为研究者普遍关注的问题。被引频次是指
论文部分内容阅读
科技文献的数量呈爆炸性增加,科研知识的演变和进化更加迅捷,难以快速掌握。如何从大量科技文献中快速分辨出具有较高阅读价值的文献成为研究者普遍关注的问题。被引频次是指在一段指定的时间段内科技文献被其他文献引用的次数,是评估科技文献影响力和质量的重要方法。但被引频次的统计易受到当前时间点的限制,很难获得未来时间段内的被引用情况,进而影响对科技文献在科技贡献力方面的评估。亟待提供一种自动化地预测科技文献被引频次的方法,更快的识别有潜力的文献,促进科学研究和新知识的传播。本文研究科技文献被引频次预测算法。本文具体研究内容如下:首先提出对国际顶级数据挖掘比赛KDDCUP中冠军算法进行优化改进,在划分训练和测试集合之前加入对文献主题词的分析,按照主题词对文献集合进行聚类,在每个类中进行回归预测,以减少因为主题时间点引用情况差异对预测准确性的影响。实验分析显示,改进的算法比原算法的预测准确度提高3.4%。其次针对目前已有算法的不足,本文提出一种新的基于时间序列相似度聚类的被引频次时间序列预测方法,运用时间序列回归建模和相似度聚类等数据挖掘技术,不但能够自动分析每个文献出版后的被引用情况,获得每个月份的平均被引频次,还通过聚类挖掘出文献的不同被引模式,进而根据待测文献的已有时间序列预测出未来的被引频次。通过实验分析发现,新的算法比原算法预测准确度提高6.5%。
其他文献
位置服务(Location Based Services,LBS)一直是人们热议的话题,多年来人们对定位技术探索的脚步从未停止过。目前在室外环境下,定位技术中最具有代表性的要数GPS全球定位系统
近几年,通信技术迅猛发展,随着大量新的通信业务投入运营,频谱资源短缺问题日益彰显,并已然成为了通信技术进步的一大瓶颈。认知无线电作为解决上述问题的有效手段,引起了广
本文以减小兴波阻力,提高船行驶速度为应用背景,以哈尔滨工程大学船舶学院实验水池中船模在水池中运动产生的波浪为研究对象,对波浪的波形进行分析研究,绘制其对应的等高线图
随着卫星遥感技术的迅速发展,遥感技术从最初的军事领域到现在的民用领域已被广泛应用。国内外各行业和科研机构也逐渐获取、积累了海量的遥感数据,为满足行业用户的数据需求
目的1.研究胚胎干细胞转录因子Nanog蛋白在昆明(kunming,KM)小鼠植入前胚不同发育阶段的定位表达情况;2.研究雌激素受体α(estrogen receptorα,ERα)特异性抑制剂MPP(20μM)
水声传感器网络对于海洋中军事情报的收集、资源勘探开发、灾害预警等许多军用民用领域具有十分重要的作用。水声传感器网络的最大特点是采用水声声波进行通信,与传统无线电
开放经济下的最优货币政策规则一直是货币政策研究的一大热点,而这类话题被谈论的最多的则主要集中在央行应该盯住哪种通胀目标,以及是否需要对汇率波动进行管控等等。计价货
网络编码是一种在路由节点上对不同信息流的编码组合再转发的处理机制,打破了路由节点传统存储转发信息的工作模式,为解决通信中的问题提供了新思路。无线双向中继系统是中继
因水对光的吸收和散射作用以及海洋环境的复杂性等因素影响,导致水下光图像对比度较低、目标边缘模糊并且纹理弱,造成水下光图像质量降低和图像有用信息的缺乏问题,给水下目
随着城市的飞速发展,传统卫星导航接收机在日益复杂的城市环境中面临着严峻的挑战。对于穿梭在城市高楼之间的车载卫星导航接收机而言,由于高楼或树木的阻挡,卫星信号频繁地