论文部分内容阅读
在学术研究、科技创新与教育实践中,科学数据管护是主动、持续地贯穿数据生命周期的管理活动。科学、有效、合理的数据管护可以规范农业科学数据资源管理过程和管理行为,保障科学数据的安全存储,提升数据的价值,实现数据的共享再利用,有助于促进农业科技创新和社会经济发展。目前,海量的农业科学数据通常分散在各单位或者各科研团队中,数据资源在不同的科研团体之间难以得到共享;管理部门尚未形成有效的汇交机制,因此不同学科领域的农业科学数据难以汇交,数据之间的关联价值也难以得到挖掘利用。综上,迫切需要构建一种统一规范的农业科学数据全流程管护模型,解决在生产、汇交、组织整合、安全存储、共享再利用等方面出现的数据管护问题。本研究以数据生命周期理论为重要支撑,以农业科学数据的管护问题为导向,通过文献计量分析法、数据政策质性分析法等科学研究方法,了解了当前科学数据管护的现状,梳理了科学数据管护过程中出现的问题,总结了科学数据管理过程中数据用户的需求,归纳了数据管理政策所关注的主要内容。在认真梳理总结的基础上,基于数据生命周期理论,借鉴英国数据管理中心DCC模型,创新性地提出了一种基于生命周期理论的农业科学数据全流程管护模型,模型的提出为农业科学数据管护实践提供了理论框架和应用指南。英国数据管理中心DCC模型的核心是面向科研活动的,农业科学数据全流程管护模型是面向科学数据的管理。基于DCC的农业科学数据全流程管护模型的流程包括了数据的创建汇交、评价选择、提交、保护、存储、利用与转化的数据全生命周期,流程模型细化至13个,并分为前期-中期-后期:前期包含解析国家政策、制定数据管护计划、对数据用户进行需求调查以及设计管护方案;中期包含数据的收集汇交、组织存储;后期包含数据的备份、分析利用、有机融合新的科学数据。流程模型基于生命周期侧重数据每个阶段的管理,大大丰富了农业科学数据的管护内容。本研究结果表明,农业科学数据是动态的信息资源,每个数据管护的过程都是动态的,从而体现出了科学数据的全生命周期的基本特征。基于生命周期的数据管护,需从原始数据到中间数据,再到最终研究结果的科研项目相契合。基于以上的研究,本文提出了由职责分工、农业科学数据汇交与管理、科研产出关联数据的汇交管理、数据的开放共享、保障机制以及数据安全共六个模块组成的中国农科院科学数据管护体系,农业科学数据全流程管护模型在中国农科院进行的实证研究中得以验证。本研究创新性地提出了基于生命周期的农业科学数据全流程管护模型,与英国数据管理中心DCC模型相比,流程更为细化,每一个环节的管理职责更为清晰。应用了嵌入式理论,在管护模型中嵌入了科研项目、科研人员、数据管理平台等要素;基于生命周期理论,丰富了管护流程,覆盖了农业科学数据管护的数据收集汇交、组织整合、安全存储、共享再利用的全过程,对农业科学数据的管护具有较强的理论和应用价值。