基于多源异构数据的科研团队画像构建方法

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:gipy2a1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在近现代科学发展史上,许多重要的、原创的科研成果都来自于优秀的科研团队。科研团队能够实现团队间的信息资源共享,提高科研生产率和促进科研创新。国家的科技体制改革以及《国家中长期人才发展规划纲要》已明确提出推进科研团队发展,因此科研团队的重要性不言而喻。由于科研团队数量的增多,相应的也出现了一些问题。现阶段,评审专家通过科研团队提交申报表进行科技创新团队评审工作,申报表内容多是文字形态,不能够直观地展现团队信息,而且对信息的真实性也无从判断。因此,准确、全面地描述科研团队,对于管理层全方位了解、客观评价科研团队等方面具有重要作用。为此,本文基于多源异构数据,提出科研团队画像的概念,并在概念的基础上给出了科研团队画像的构建方法。本文首先给出科研团队画像是描述科研团队信息的标签集这一概念。然后从团队整体和团队成员两个方面对团队属性特征进行分析。将分析出的团队属性特征所对应的数据类型进行处理,以电子文献库、国家基金网、个人主页等多个异构数据源为基础,提出融合多源异构数据的团队画像构建方法。然后分别从科研团队的成员基本信息、团队学术专长、团队科研成果以及团队合作关系四方面描述科研团队属性信息,并提取各个维度的信息构建标签框架。通过构建合作网络并借助社交网络分析方法的相关指标提取科研团队整体属性和团队成员属性的属性值。最后,利用实际中的科研团队数据,以D大学的某团队为例,将科研团队画像可视化展现出来,验证本文构建方法的可行性与有效性。本文旨在给出构建科研团队画像过程所需要用到的方法以及科研团队属性特征的计算方式,因此可以针对不同的应用场景,选取不同的关键属性来有目标的进行科研团队画像;并利用现有信息来分析团队的属性,解决如何利用多源异构数据以及从哪些方面实现科研团队画像,以便全面准确地提供科研团队信息,为科技决策及相关部门提供真实参考依据。
其他文献
移动通信技术的发展让人们对卫星通信提出了更高的需求。构建具有广覆盖、高传输速率的星地融合网络势在必行,地面5G移动通信系统与低轨(Low Earth Orbit,LEO)卫星移动通信系统的融合在其中扮演着重要的角色。正交频分复用(Orthogonal Frequency Division Multiplexing,OFDM)技术以其频谱利用率高、资源分配方式灵活、便于与其他技术融合以及与地面移动通
资金如同企业的血液,企业的生产发展离不开资金的支持。信息不对称、代理问题的存在导致外部融资成本往往高于内部融资成本,从而对企业资金使用造成限制,形成融资约束。企业
随着环境问题的日益严重,人与自然的关系成为人类社会当前面临的最为重要的议题之一。单一主体的绿色行动对环境治理问题的作用有限,绿色治理作为一种新的治理观被提出。绿色治理强调多元治理主体的协同作用,而企业是绿色治理最为关键的行动者。钢铁工业是中国国民经济最为重要的基础产业之一,同时也是高污染、高能耗的行业。近年来,在国家大力推进生态文明建设的大背景下,钢铁企业的能耗比重有所降低,污染物排放量也得到控制
大学生是新时代青年的代表,在思想方面,必须坚定理想信念,做讲政治的新青年。在思想政治教育学习中,大学生切实有所得、有所感,有助于大学生构建正确的认知结构。本文详细阐述了思想政治教育获得感内涵、大学生思想政治教育获得感现状及如何提升大学生思想政治教育获得感。并以马克思主义人学理论和心理学学习理论为理论基础,根据心理学学习理论中的认知主义、人本主义和行为主义分析出思想政治教育获得感的基本构成。以认知、
机械装配质量直接影响机电产品的整体质量,其检测是复杂机电产品制造质量保证的重要组成部分。现代机械制造正朝着轻量、高速、高效、高精度、智能化的方向发展,这对装配质量检测提出了更高的要求。如何建立一套功能全面且操作简便的检测指标与规范方法,是机械装配质量检测领域的重要问题。目前,常规的机械装配质量检测主要集中在诸如公差与尺寸协调性等的“静态质量”指标,尚缺乏装配“动态质量”的关注和研究,这不利于产品整
随着5G通信时代的到来,人工智能、云计算和物联网等相关行业的不断壮大,越来越多的数据以流的形式增长。由于数据随时间不断涌现,因此难免出现结构分布改变的现象,即概念漂移
自古以来,知阴谋、善使阴谋者大有人在。关于如何使用阴谋的书籍在西方著作中以《君王论》为代表,而东方著作更是络绎不绝:自《鬼谷子》一书宣扬趋炎附势,讲究为达目的,誓不
本文基于提高税收风险管理水平的要求和热力行业增值税管理的现实状况,对热力行业增值税税收风险识别进行研究。首先对热力行业生产经营规律和增值税管理现状做了简要介绍,深入分析当前热力行业增值税税收风险产生的原因,归根结底是由于缺少一套科学有效的税收风险识别模型,归纳整理税收风险的主要表现和这些表现在税务机关掌握数据上的反映,为税收风险识别模型的建设打好基础。为了能够更加准确有效地建立热力行业增值税税收风
伴随着互联网技术的日渐普及,越来越多的用户开始接触社交网络并养成了使用社交网络的习惯。人们关心的日常话题会在第一时间以最快的速度通过社交媒介传播开来,尤其是与人们生活密切相关的国民安全话题。突发话题出现时,大量的相关舆情信息会在以微博为代表的社交网站中传播。为了能够迅速准确地检出相关的突发话题,本论文实现了海量数据的实时采集和突发话题检测、挖掘与演进规律发现系统,采用自然语言处理技术等高效地检测突
地震发生后,如何快速获取灾区震情信息、绘制地震烈度图并准确评估地震灾情,是震后应急救援的关键问题。目前对于地震烈度的评估,尚未用到植被这一变化因素,但这一因素有以下几个优点:(1)植被覆盖反演有成熟的手段和方法;(2)计算简便,节约时间;(3)用于反演植被覆盖的遥感数据源很多。本文旨在探究地震前后植被覆盖的变化与烈度之间的关系,并分析地震前后植被覆盖的变化能否作为评估烈度的参考依据。目前的研究中,