论文部分内容阅读
本世纪以来,科技水平的进步使人类生活得到了极大改善。科技领域的创新成果层出不穷,其中形成了信息技术、智能制造、生物科学等一批高新科技产业,推动着生产力的发展和社会的变革。这高速发展的科技浪潮背后,离不开成千上万科研学者的坚守和耕耘。因此,对科研学者这一关键群体的研究,对解释科学发展水平、推动科技革新有着重要意义。随着互联网技术的不断迭代,基于个人数据模型的用户画像技术得到了快速推广,利用多维度标签化的形式,可以更加直观方便的进行用户研究和应用支持。因此,本文将结合用户画像技术,对科研学者进行画像构建和应用研究,具体研究内容包含三个方面。首先,利用互联网上采集的学术数据资源构建基础数据库,作为画像构建和应用的信息基础。而在传统针对科研学者的学术研究中,数据的来源不一、结构各异对结果有着直接的影响。因此,还需要对多源数据集进行充分地信息融合,以保证数据的数量和质量。其次,在深入了解用户画像原理后,利用统计分析和数据挖掘方法合理地设计画像模型。将画像主要内容划分为基础维度和进阶维度:基础维度中包含人口统计学维度和专业学术维度,涵盖个人属性信息和学者学术信息,并利用信息检索算法进行数据扩充;进阶维度主要表示学者的个性化特征,包含其研究兴趣和兴趣演化等。最后,从多个方面进行了画像应用研究。在基于内容和影响力的论文推荐方法中,通过考虑论文重要性和学者研究兴趣,为学者进行优质论文推荐。在学者潜在合作关系挖掘中,利用复杂网络中的链路预测方法,对网络特征和兴趣特征权重进行控制,从而选择出一种准确度较高的方案,挖掘出学者潜在合作关系。此外,还利用画像标签展示了部分学术指标的地理分布特征,并对学术合作情况进行分析,具体包含同一领域内合作、院校合作和全球化合作情况。通过数据化分析的方式,对科学研究水平的差异和科技发展的趋势进行了客观、合理的解释。