论文部分内容阅读
通过属性规约、空缺值处理及异常值检测,对中国科技论文在线2003-2009年37 898篇首发论文数据进行数据预处理。对数据预处理后的37 348篇首发论文,构建下载次数的回归树模型,通过模型结果分析,得出下载次数的影响因素依次为首发论文的发表时间、所属学科以及首发论文的星级评定结果,并分析下载次数在这三个方面的典型特征。