论文部分内容阅读
科学数据是国家经济社会发展的关键战略性资源,并在信息基础设施中占据重要地位。实现科学数据的开放共享,不仅能够提高科学研究结果的可检验性和公信力,并且还能为更多的科学研究提供丰富的基础材料,产生更多的科学知识。另外,对于促进科研工作者相互协作也具有重要意义。采用最新的信息技术,特别是互联网和Web技术,是实现数据开放的必然途径。关联数据是在Web上发布和互联结构化数据的一组最佳实践。本文利用Drupal开源内容管理框架对于关联数据的发布与消费进行了具体实践,所选用的目标数据集为中国自然科学基金委所资助的项目数据集。主要包括以下内容:(1)对文章所涉及的的理论以及概念做了必要介绍,包括关联数据,本体,特别是与关联数据紧密相关的资源描述框架(RDF)进行了细致深入的叙述。(2)建立项目资助信息的数据模型,并用本体建模语言进行描述。不仅需要对资助信息所涉及的具体字段进行研究,同时也需要对字段间的关联信息进行发掘。在此之上重用了 SWRC,FOAF,Organization和SKOS本体,并利用Protege本体构建工具完成了该本体模型的建立。(3)对Drupal进行简单介绍,并对Drupal实现关联数据的发布与消费整个实践过程展开叙述。完成了基于Drupal的关联数据发布平台的建立,另外也对如何利用Drupal中的Sparql View,Sparql等模块实现关联数据集的消费进行了描述。通过将DBpedia的组织机构数据关联至本地关联数据集,并与DBLP数据集建立关联关系,达到了本地数据集的丰富从而更好地体现出关联数据的价值。