【摘 要】
:
为了从海量的论文中筛选出与主题相关的高价值论文,需要对论文的价值进行量化并排序。有不少研究将网络链接排序算法Page Rank进行改进并运用到论文排序中,取得了一定成效。
论文部分内容阅读
为了从海量的论文中筛选出与主题相关的高价值论文,需要对论文的价值进行量化并排序。有不少研究将网络链接排序算法Page Rank进行改进并运用到论文排序中,取得了一定成效。在常规研究中,主要关注论文之间的引用关系,鲜有关注论文正文中针对参考文献的描述(即引文)。已有研究证明引文可体现被引文献的主要内容和引证者从被引文献中利用的信息,对引文进行分析可更详细地研究引用行为,使基于引用网络的论文排序结果更加准确,且有利于揭示被引文献主题,因此本文将引文分析融入论文价值计算和文献主题分类的过程中。首先在WPage Rank算法融入论文发表时间因素的基础上,加入对引文的分析,通过提取引文中的关键词计算出论文间的引用相关度,同时考虑期刊影响因子和论文发表时间,从而计算得出论文的固有价值,并将引用相关度和论文固有价值加入WPage Rank算法中,提出了改进的RVWPage Rank算法。经过实验表明,RVWPage Rank算法使新发表的高质量文献也可以获得较高排名,并且使领域内的高质量文献更容易被检索到,同时保证了检索的时效性和主题集中性,削弱了“冷启动”现象带来的负面影响。其次,针对只依据论文价值排序不易快速找到检索结果涵盖的研究方向的问题,本文结合引文分析技术、改进的论文价值计算方法和LDA主题模型,对不同领域的论文分别进行了主题聚类,并筛选出各主题下的高价值论文,研究人员可依据得出的主题和该主题下的高价值论文快速了解某个领域的主要研究方向和研究成果。最后,开发搭建了基于引文的科技论文价值分析与可视化系统,并结合引文分析方法对论文价值、引文内容、论文间引用关系通过关系图的形式进行了可视化,通过饼图、树形图、柱状图等形式对作者研究状况进行了可视化。
其他文献
儿童时期是孩子一生中的发展关键期,家庭中较好的成长发育环境,更有利于儿童在该时期得到良好的启蒙式教育。当代家长为了让孩子从小赢在人生的起跑线上,从而致力于孩子运动能力、思维能力、语言能力等多方面能力的锻炼培养。在童年生活中,儿童或多或少都会接触到一些形态各异的儿童类产品,该类产品在儿童的成长过程中,主要起到陪伴儿童玩耍的作用。其中,儿童平衡车作为学龄前儿童最喜爱的运动方式之一,不仅受到了儿童的热烈
多年来,基于准时化(JIT)生产的混流装配线排产优化问题研究一直是学术界和企业界研究复杂组合优化问题中的重点和热点,这方面取得的成果和成就也比较多。然而我国还有不少企业的混流装配线采用的是基于非准时制的生产模式,即用于装配的零部件才刚生产完或者正在生产,而不是开始装配前所有的零部件都已准备完毕。此种模式下的排产优化问题鲜有学者研究,尤其是带有缓冲区约束的复合型混流装配线排产优化问题,它是柔性流水车
图谱数据是一种重要的数据表示,它出现在各种各样的现实世界场景中,例如,社交网络中的社交图谱,研究领域中的引文图谱,知识图谱等。有效的图谱分析可以使用户更深入地了解数
当前,我国经济增长的外部环境十分严峻,政府做好项目建设项目决策是扩内需、防下滑,保持经济平稳较快发展的迫切需要,也是调结构、促转型,保持跨越式发展势头的重要途径。近
光伏发电系统主要通过光生伏特效应将自然界的光能转化为人类所需求的电能。光伏阵列在标准外部环境下,其功率-电压(power-voltage,P-V)特性曲线呈单峰现象。对于此种理想环
我国政府自2006年开始颁布和实施科技企业孵化器认定政策以来,认定政策在引导我国科技企业孵化器高质量发展、支持科技型中小微企业快速成长方面发挥了重要作用。从理论讲,政
本文研究的是一类退化抛物方程的边界控制问题,其中控制函数作用在退化边界上,并且边界条件为第二边界条件.本文得到了该问题的近似可控性.证明结果显示:对于任意的一个目标函数,都可以找到一个控制函数,使得该问题的解在有限时间内可以充分接近目标函数.本文第一章介绍了此类问题的背景,国内外的相关工作以及本论文中研究的主要问题,方法和结果.本文第二章研究了一类含对流项的线性退化抛物方程,并证明了这类方程在边界
在我国制造业转型升级的关键期,企业的技术创新水平与能力成为企业获得市场竞争力的关键要素,也是国家实现《中国制造2025》蓝图的关键支撑。但是企业的创新选择及资源配置会
哈萨克斯坦现阶段成为世界石油大国之一,是以第一 口石油井投产120多年来的历史发展为前提条件的。如今能源部门是哈萨克斯坦货币和金融稳定的主要来源。能源工业的发展对哈
癌症是威胁人类公共健康的首要原因。因此,癌症的早期筛查和准确诊断极其重要。医学影像作为主要的癌症诊断方法,被广泛应用于临床诊断中。日益精细化的医学影像提供了大量的