论文部分内容阅读
〔摘 要〕本文提出了元数据在特色数据库建设的三方面的作用,并以华中师范大学自建的数据库桂子文库为例,用翔实的材料描述了元数据在特色库建设实践中的资源组织、资源利用和数据库管理等方面作用的具体体现。
〔关键词〕资源组织;元数据;桂子文库
DOI:10.3969/j.issn.1008-0821.2011.12.014
〔中图分类号〕G250.74 〔文献标识码〕B 〔文章编号〕1008-0821(2011)12-0052-02
Metadatas Application and Practice on Characteristic
Database in University Library
——Example as Guizi Database of Huazhong Normal UniversityChen Haiyan
(Library,Central China Normal University,Wuhan 430079,China)
〔Abstract〕The article introduced metadatas three fundations on Characteristic Databases Building.It described and showed resource organization,resource application,database management of metadata on Characteristic Databases application and budiling by detail infomations,example as Guizi Database project of Huazhong Normal University.
〔Key words〕digital resource organization;metadata;Guizi Database
近年来,随着高校文献保障系统和数字图书馆工程的推进,各地区许多高校图书馆都在特色资源数字化建设中挖掘自身的潜力优势,扩展服务空间,建立了以本校学科优势为特色的专题数据库,为高校读者提供深层次的学科服务。为了推动了高校教学、科研水平的交流与提高,增强学校科研成果的彰显力,我校图书馆开发建设了华中师范大学教师科研成果文献数据库——桂子文库。桂子文库是收藏和保存学校教师和学者的学术科研成果文献的数据库,具有数字资源采集、加工、管理、存储、交换和发布等一系列功能,桂子文库面向全校读者提供个性化的文献内容服务、咨询服务、教学与科研支持服务、以及其他相关服务。
高校图书馆在进行特色数据库建设中,需要把相关的文献信息资源按照一定的原则进行收集、组合和有序的整理,这就是特色数据库要进行的信息资源组织。图书馆在进行信息资源组织时,是通过元数据来承担和实现的。我馆建设的桂子文库,就是基于DC元数据完成其对信息资源的组织和服务的。
1 元数据在特色数据库建设中的作用
元数据是用来描述数据本身内容和其他特征的数据,在数据库建设中,主要承担着描述信息、定位数据、检索资源、评估资源等重要作用。在特色数据库建设过程中,元数据承担着增加系统数据可信性、系统可用性以及资源发现能力等重要作用,是各方面功能、互操作以及参与聚合性服务等得以实现的关键。元数据在特色数据库建设中的作用主要体现在以下几个方面:
1.1 资源组织方面
建立能够有效满足用户需求的高质量特色数据库,必须提取资源相关特征的元数据(题名、作者、关键词等),并科学地组织起来,便于资源的利用。这是特色数据库数据建设要解决的问题。文献信息资源根据特色数据库的需要,遵循设计好的元数据格式被有效地组织、分类,被严格地标注、描述。
1.2 资源利用方面
特色数据库经过对相关资源特征抽取和标注以后最终的目的是提供给用户利用,这里的利用包括数据库查找、识别、挑选、获取和数据复用等。资源的检索、浏览和定位借助于资源组织时抽取和标注的特征元数据实现,其对于元数据质量的要求就是涵盖全面、标注准确。数据复用则要求元数据应该从多个角度对同一资源进行描述,元数据质量方面的要求是元数据的准确性、描述项目的标准化且应有一定可拓展性。
1.3 数据库管理方面
建成的特色数据库除满足用户利用方面的需求外,还要满足特色数据库管理者管理方面的需求,如数据库所有权、安全控制、数据库及数据库部分内容访问统计、数据库之间互操作,这都需要借助于相关元数据实现。互操作管理元数据要求在建设过程尽可能采用相关、适用面广的标准,其他管理方面元数据则要求根据需要在数据库设计时设置好相关元数据字段。
元数据在高校图书馆特色数据库建设中的应用与实践2 元数据在桂子文库建设中的应用及实践
2.1 桂子文库建设中采用元数据的标准与原则
桂子文库是收集保存我校教师科研成果文献数据库,在对科研成果数据调研分析之后,确定了几种文献类型,分别是个人信息、学术论文、论著教材和其它成果,这也成为了桂子文库的子库即子栏目。在确定了桂子文库文献资源类型之后,我们采用现有的CALIS元数据标准规范,设计了相应子库的元数据方案,对文献资源进行描述、序化和组织。
桂子文库元数据遵循了CALIS元数据标准规范——《CALIS特色库子项目描述元数据规范及相关规则》、《CALIS特色库管理型元数据规范》,元数据的设计上具有标准化、描述准确性、通用和专用性、互操作性等特点。在对元数据进行扩展过程中严格执行了元数据扩展的规范化和标准化规则,即在扩展过程中,扩展的子元素及其限定词必须与原有元素语义定义保持严格一致,不能超出元素固有的语义范围。对于自建元素也进行了严格的语义界定和说明,以保证著录的准确性。
2.2 元数据对桂子文库的资源组织
在桂子文库的元数据设计方案中,学术论文、论著教材和其它成果虽然属于各种类型的科研成果,但在用元数据对它们描述上存在着共性的信息,因而设计了部分共用元素,即:〈题名〉〈主要责任者〉〈机构〉〈关键词〉〈摘要〉〈描述〉〈中图分类号〉〈资源类型〉〈文献引用〉〈标识符〉〈全文〉等,这里〈关键词〉和〈中图分类号〉是由“主题”元素扩展而来的;〈描述〉〈文献引用〉〈标识符〉等元素是根据学术论文、论著教材和其它成果的文献资源特征,做了元素的进一步扩展,比如:在著作教材子库中,〈描述〉的主要修饰词为〈摘要〉和〈丛编题名〉,扩展了两个元素:〈获奖情况〉和〈基金项目〉,〈获奖情况〉用来描述著作的获奖信息,〈基金项目〉可标明该著作为某个国家级项目的成果。
个人信息库是收集科研成果作者的信息库,因而它的元数据结构不同于其它的3个子库,其元数据的主要元素为:〈姓名〉〈职称职务〉〈工作单位〉〈主要研究方向〉〈个人简介〉〈获奖情况〉〈科研项目〉等,对作者做了基本信息的描述和定位。
桂子文库对收录的数据进行归类入子库并按照其各子库的元素进行标引,实现了科研成果文献数就被有效有序地组织起来。
2.3 元数据在桂子文库中的服务功能的实现
桂子文库主要服务功能有检索功能、导航功能、关联功能、排行榜功能等,元数据是帮助这些功能得以实现的基本要素。
检索功能是数据库具有的最基本的功能,桂子文库首页中的高级检索是用几个主要元素来实现的,它同时又具有跨库检索的能力,这是通过学术论文、论著教材和其它成果3个子库的库结构中的共用元数据来实现的。
桂子文库的学科导航是用中图分类法进行的导航分类的,这是根据科研成果子库都有的一个共同元素〈中图分类号〉来实现的,通过导航,可方便地检索出某类别的文献成果。此外,还有一个院系导航,这是根据个人信息库的元素〈工作单位〉来实现的,点击院系导航的任一单位,可以搜索到这个院系的教师的基本信息情况。
关联功能是桂子文库使用功能的一个重要功能,通过关联点,可以迅速快捷地查找文献资源。桂子文库利用元数据实现的一个关联点是〈关键词〉,通过点击这个元素中标引的任何一个关键词,可以检索出含有这个关键词的所以科研成果记录;利用元数据实现的第二个关联点是〈主要责任者〉,点击这个元素中标引的作者名,就可以检索出这个作者的所有科研成果记录。
桂子文库具有排行榜的功能,我们制作了文献点击率排行和作者点击率排行,这是通过元数据的一个元素〈hitcount〉来实现的。在数据库的库结构中,置入这样一个字段,使每一条数据记录都有了点击数量,系统根据这个字段列出数据点击排行的情况。
2.4 元数据在桂子文库管理方面的应用
桂子文库数据库的后台管理中,制作了对用户访问的功能,在数据库的底层库结构中置入了元素〈hitcount〉,因每条记录都含有这个元素,在对数据进行访问统计时,根据定位元数据实现了对各子库的分类访问统计。
在数据安全管理方面,桂子文库利用元数据进行了数据安全控制。桂子文库的文献数据大部分是全文数据,在校园网内可以访问全文,在校园网外不能访问全文,但是通过分配的用户名和密码登录桂子文库,可以者校外进行桂子文库的全文访问。
元数据在桂子文库数据库的建设中组织文献信息资源、描述文献资源及定位,并且帮助实现了数据库的文献利用与各种服务功能,管理型元数据又对特色数据库的数据管理起到了一定的作用。
3 结 语
特色数据库建设过程中,对元数据的应用上,经常会遇到一些现有标准体系无法涵盖的需求,需要在现有标准基础上进行扩展,如果把握不好就可能造成元数据冗余。希望CALIS的中文元数据标准规范体系能够进一步得以完善,让图书馆自建数据库建设时能找到各种类型文献资源的相应的标准规范可以依据。增加检索的准确性,提高数据检索的能力也是特色数据库的服务功能建设的主要问题,高层次的描述符便于更精确的内容检索。因此,需要更进一步的把低层元数据和尽可能多的基于内容的元数据合并。通过合并,能够进行更精密的推理和规则。作为远景规划,希望CALIS在元数据标准规范建设时能推进元数据与语义集成的研究,提高数据库的检索效率,充分发展元数据在特色数据库建设中的作用。
参考文献
[1]李凌杰.特色数据库建设中的元数据质量控制研究[J].图书情报工作,2010,(5):43-46.
[2]董蓓.DC元数据在专题特色数据库建设中的应用——以南开大学图书馆“跨国公司研究专题数据库”为例[J].图书馆工作与研究,2010,(4):42-44.
[3]张海玲.多媒体元数据的语义集成和检索[J].情报科学,2007,(7):1052-1057.
〔关键词〕资源组织;元数据;桂子文库
DOI:10.3969/j.issn.1008-0821.2011.12.014
〔中图分类号〕G250.74 〔文献标识码〕B 〔文章编号〕1008-0821(2011)12-0052-02
Metadatas Application and Practice on Characteristic
Database in University Library
——Example as Guizi Database of Huazhong Normal UniversityChen Haiyan
(Library,Central China Normal University,Wuhan 430079,China)
〔Abstract〕The article introduced metadatas three fundations on Characteristic Databases Building.It described and showed resource organization,resource application,database management of metadata on Characteristic Databases application and budiling by detail infomations,example as Guizi Database project of Huazhong Normal University.
〔Key words〕digital resource organization;metadata;Guizi Database
近年来,随着高校文献保障系统和数字图书馆工程的推进,各地区许多高校图书馆都在特色资源数字化建设中挖掘自身的潜力优势,扩展服务空间,建立了以本校学科优势为特色的专题数据库,为高校读者提供深层次的学科服务。为了推动了高校教学、科研水平的交流与提高,增强学校科研成果的彰显力,我校图书馆开发建设了华中师范大学教师科研成果文献数据库——桂子文库。桂子文库是收藏和保存学校教师和学者的学术科研成果文献的数据库,具有数字资源采集、加工、管理、存储、交换和发布等一系列功能,桂子文库面向全校读者提供个性化的文献内容服务、咨询服务、教学与科研支持服务、以及其他相关服务。
高校图书馆在进行特色数据库建设中,需要把相关的文献信息资源按照一定的原则进行收集、组合和有序的整理,这就是特色数据库要进行的信息资源组织。图书馆在进行信息资源组织时,是通过元数据来承担和实现的。我馆建设的桂子文库,就是基于DC元数据完成其对信息资源的组织和服务的。
1 元数据在特色数据库建设中的作用
元数据是用来描述数据本身内容和其他特征的数据,在数据库建设中,主要承担着描述信息、定位数据、检索资源、评估资源等重要作用。在特色数据库建设过程中,元数据承担着增加系统数据可信性、系统可用性以及资源发现能力等重要作用,是各方面功能、互操作以及参与聚合性服务等得以实现的关键。元数据在特色数据库建设中的作用主要体现在以下几个方面:
1.1 资源组织方面
建立能够有效满足用户需求的高质量特色数据库,必须提取资源相关特征的元数据(题名、作者、关键词等),并科学地组织起来,便于资源的利用。这是特色数据库数据建设要解决的问题。文献信息资源根据特色数据库的需要,遵循设计好的元数据格式被有效地组织、分类,被严格地标注、描述。
1.2 资源利用方面
特色数据库经过对相关资源特征抽取和标注以后最终的目的是提供给用户利用,这里的利用包括数据库查找、识别、挑选、获取和数据复用等。资源的检索、浏览和定位借助于资源组织时抽取和标注的特征元数据实现,其对于元数据质量的要求就是涵盖全面、标注准确。数据复用则要求元数据应该从多个角度对同一资源进行描述,元数据质量方面的要求是元数据的准确性、描述项目的标准化且应有一定可拓展性。
1.3 数据库管理方面
建成的特色数据库除满足用户利用方面的需求外,还要满足特色数据库管理者管理方面的需求,如数据库所有权、安全控制、数据库及数据库部分内容访问统计、数据库之间互操作,这都需要借助于相关元数据实现。互操作管理元数据要求在建设过程尽可能采用相关、适用面广的标准,其他管理方面元数据则要求根据需要在数据库设计时设置好相关元数据字段。
元数据在高校图书馆特色数据库建设中的应用与实践2 元数据在桂子文库建设中的应用及实践
2.1 桂子文库建设中采用元数据的标准与原则
桂子文库是收集保存我校教师科研成果文献数据库,在对科研成果数据调研分析之后,确定了几种文献类型,分别是个人信息、学术论文、论著教材和其它成果,这也成为了桂子文库的子库即子栏目。在确定了桂子文库文献资源类型之后,我们采用现有的CALIS元数据标准规范,设计了相应子库的元数据方案,对文献资源进行描述、序化和组织。
桂子文库元数据遵循了CALIS元数据标准规范——《CALIS特色库子项目描述元数据规范及相关规则》、《CALIS特色库管理型元数据规范》,元数据的设计上具有标准化、描述准确性、通用和专用性、互操作性等特点。在对元数据进行扩展过程中严格执行了元数据扩展的规范化和标准化规则,即在扩展过程中,扩展的子元素及其限定词必须与原有元素语义定义保持严格一致,不能超出元素固有的语义范围。对于自建元素也进行了严格的语义界定和说明,以保证著录的准确性。
2.2 元数据对桂子文库的资源组织
在桂子文库的元数据设计方案中,学术论文、论著教材和其它成果虽然属于各种类型的科研成果,但在用元数据对它们描述上存在着共性的信息,因而设计了部分共用元素,即:〈题名〉〈主要责任者〉〈机构〉〈关键词〉〈摘要〉〈描述〉〈中图分类号〉〈资源类型〉〈文献引用〉〈标识符〉〈全文〉等,这里〈关键词〉和〈中图分类号〉是由“主题”元素扩展而来的;〈描述〉〈文献引用〉〈标识符〉等元素是根据学术论文、论著教材和其它成果的文献资源特征,做了元素的进一步扩展,比如:在著作教材子库中,〈描述〉的主要修饰词为〈摘要〉和〈丛编题名〉,扩展了两个元素:〈获奖情况〉和〈基金项目〉,〈获奖情况〉用来描述著作的获奖信息,〈基金项目〉可标明该著作为某个国家级项目的成果。
个人信息库是收集科研成果作者的信息库,因而它的元数据结构不同于其它的3个子库,其元数据的主要元素为:〈姓名〉〈职称职务〉〈工作单位〉〈主要研究方向〉〈个人简介〉〈获奖情况〉〈科研项目〉等,对作者做了基本信息的描述和定位。
桂子文库对收录的数据进行归类入子库并按照其各子库的元素进行标引,实现了科研成果文献数就被有效有序地组织起来。
2.3 元数据在桂子文库中的服务功能的实现
桂子文库主要服务功能有检索功能、导航功能、关联功能、排行榜功能等,元数据是帮助这些功能得以实现的基本要素。
检索功能是数据库具有的最基本的功能,桂子文库首页中的高级检索是用几个主要元素来实现的,它同时又具有跨库检索的能力,这是通过学术论文、论著教材和其它成果3个子库的库结构中的共用元数据来实现的。
桂子文库的学科导航是用中图分类法进行的导航分类的,这是根据科研成果子库都有的一个共同元素〈中图分类号〉来实现的,通过导航,可方便地检索出某类别的文献成果。此外,还有一个院系导航,这是根据个人信息库的元素〈工作单位〉来实现的,点击院系导航的任一单位,可以搜索到这个院系的教师的基本信息情况。
关联功能是桂子文库使用功能的一个重要功能,通过关联点,可以迅速快捷地查找文献资源。桂子文库利用元数据实现的一个关联点是〈关键词〉,通过点击这个元素中标引的任何一个关键词,可以检索出含有这个关键词的所以科研成果记录;利用元数据实现的第二个关联点是〈主要责任者〉,点击这个元素中标引的作者名,就可以检索出这个作者的所有科研成果记录。
桂子文库具有排行榜的功能,我们制作了文献点击率排行和作者点击率排行,这是通过元数据的一个元素〈hitcount〉来实现的。在数据库的库结构中,置入这样一个字段,使每一条数据记录都有了点击数量,系统根据这个字段列出数据点击排行的情况。
2.4 元数据在桂子文库管理方面的应用
桂子文库数据库的后台管理中,制作了对用户访问的功能,在数据库的底层库结构中置入了元素〈hitcount〉,因每条记录都含有这个元素,在对数据进行访问统计时,根据定位元数据实现了对各子库的分类访问统计。
在数据安全管理方面,桂子文库利用元数据进行了数据安全控制。桂子文库的文献数据大部分是全文数据,在校园网内可以访问全文,在校园网外不能访问全文,但是通过分配的用户名和密码登录桂子文库,可以者校外进行桂子文库的全文访问。
元数据在桂子文库数据库的建设中组织文献信息资源、描述文献资源及定位,并且帮助实现了数据库的文献利用与各种服务功能,管理型元数据又对特色数据库的数据管理起到了一定的作用。
3 结 语
特色数据库建设过程中,对元数据的应用上,经常会遇到一些现有标准体系无法涵盖的需求,需要在现有标准基础上进行扩展,如果把握不好就可能造成元数据冗余。希望CALIS的中文元数据标准规范体系能够进一步得以完善,让图书馆自建数据库建设时能找到各种类型文献资源的相应的标准规范可以依据。增加检索的准确性,提高数据检索的能力也是特色数据库的服务功能建设的主要问题,高层次的描述符便于更精确的内容检索。因此,需要更进一步的把低层元数据和尽可能多的基于内容的元数据合并。通过合并,能够进行更精密的推理和规则。作为远景规划,希望CALIS在元数据标准规范建设时能推进元数据与语义集成的研究,提高数据库的检索效率,充分发展元数据在特色数据库建设中的作用。
参考文献
[1]李凌杰.特色数据库建设中的元数据质量控制研究[J].图书情报工作,2010,(5):43-46.
[2]董蓓.DC元数据在专题特色数据库建设中的应用——以南开大学图书馆“跨国公司研究专题数据库”为例[J].图书馆工作与研究,2010,(4):42-44.
[3]张海玲.多媒体元数据的语义集成和检索[J].情报科学,2007,(7):1052-1057.