论文部分内容阅读
[摘 要]XML是强大的元标志语言,是既能让机器理解,也能被人理解的“智能”语言,是发展自SGML的、具有旺盛生命力的、面向数据的语言。XML DB技术具有跨平台性、可拓展性、自描述性和结构化特征,便于异质系统间的信息互通, XML DB技术能够克服运用关系数据库开发管理信息系统的缺陷,为开发图书管理信息系统提供了新的技术途径。
[关键词]XML DB 图书 管理信息系统 设计
当前,馆藏图书具有数量多、种类杂、管理难度大等特点,随着信息技术的不断发展和馆藏图书规模的不断扩大,开发数字图书馆已经成为提高图书信息服务质量的最为便捷和有效的途径。实现馆藏图书的数字化,就是要面向未来数字图书馆的发展,实现包括多媒体在内的各种信息数据、存储管理、查询和发布等的集成化,使这些信息得以在网络上传播,实现图书信息资源的共享,从而发挥图书信息的最大效用。传统基于关系数据库开发的图书管理信息系统,其核心思想是业务决定数据。这种方式存在内在的结构性矛盾,先是业务决定数据,一旦数据字典确定下来,就会限制业务,使业务与数据相互牵连,很难适应新的业务发展。研究表明,这种业务决定数据的模式是不恰当的,数据是对象的自身特性,是不依赖业务系统的。恰当的过程应该是先确定要处理对象的数据格式描述,然后在此基础上开展各种相适应的业务活动,XML DB技术能够克服运用关系数据库开发管理信息系统的缺陷,为开发图书管理信息系统提供了新的技术途径。
一、XML DB技术的基本思想
XML是(Extensible Markup Language,可扩展的标记语言)的缩写。XML是强大的元标志语言,是既能让机器理解,也能被人理解的“智能”语言,是发展自SGML的、具有旺盛生命力的、面向数据的语言。XML技术具有跨平台性、可拓展性、自描述性和结构化特征,便于异质系统间的信息互通,XML由W3C(国际互联网页联盟)统一制定,设计者可以为文档建立自己的标签(tags),这种标签不是固定的,不需要记忆,易于理解。因此可以根据图书管理信息系统的需要创建任何数量的图书专业标记。由于其中的每个项目都有自己的名字,而这个名字又与文档所描述的图书问题所涉及的某项具体内容密切相关。用XML编写的文档增强了文档的可读性,容易交流和维护。标识本身的含义与其所描述的信息相分离。它利用一个DTD规范来定义XML文件的语法、语句和数据结构的标准。XML带有一个XML语法分析器,它使用DTD规定一个文件是否规范,即包括正确定义的开始和结束标记。目前,图书行业已有专门的描述规范,有些已经形成标准。但要建立一个真正的图书信息管理系统,还必须提供信息的产生,存储、查询、提取、修改等功能,也就是需要一个完全能够支持XML技术的数据库管理系统,这样有产生了XML DB系统。
XML技术是由一系列可拓展标记语言相关的标准构成,主要包括:XML、XSL和XLINK。XML规定了数据的语法和语义结构。在XML之上的被称为RDF(资源描述框架),并为XML提供元数据编码定义,是XML文档的元数据;XSL(可拓展样式语言)是基于XML的格式化和可视化语言,包括两个部分:一是用于转换XML文档的方法,二是用于格式XML文档的方法;XLINK(可扩展链接语言),是基于XML的超文本链接标准。XML使用DTD和XML Schema来实现其模式定义。DTD通过一套标签的语法定义来描述XML文档中能够使用的标签、标签出现的顺序以及属性等;XML Schema采用XML语法结构,具有丰富的数据类型,能够用来定义新的数据类型,也可以在定义中使用命名空间(NameSpace)。命名空间是一个应用于XML文档的具有结构的元素名称和属性名称的集合。
XML DB技术能够满足开发图书管理信息系统的需要并可以提供如下支持:
1、提供了一个面向XML的数据类型来存储和管理XML文档。
2、能够依据提供的标准W3C Schema数据模型来创建和管理数据。
3、利用XML/SQL模型来实现对关系型数据表数据和XML的统一操作,实现同以往系统的兼容。
4、支持标准的协议来实现对XML文档的入库和出库,例如Http,FTP,WebDAV等,为数字图书馆提供开放式的接口。
目前XML DB形成两大阵营:XML-Enabled DBMS(XED)和Native XML DBMD(NXD).XED是在原由数据库基础上扩展了XML支持模块,完成XML数据和数据库之间的格式转换和传输。NXD采用的是层次数据存储模型,保持了XML文档的树型结构,不支持XML文档与关系数据库之间转换。 总之,XML DB可以实现对XML文档的存储和管理,提供多种XML文档内容的操作方法和性能优化方法,有利于图书管理信息系统的开发和应用。
二、基于XML DB技术的图书管理信息系统开发方法
XML DB提供了XML文档管理的底层服务,根据数据决定业务的新模式,在XML DB模式下开发图书管理系统与传统的方法有很大的不同,下面以基于ORACLE9I XML DB开发图书管理信息系统为例来加以说明。
1. 利用W3C Schema数据模型来描述图书资源数据格式。
首先要明确图书管理系统需要管理那些类型的图书资源,目前主要包括普通图书,电子文档、多媒体等。然后确定图书类型的形式和内容格式,需要用Schema数据模型来进行描述。目前可以用行业标准规范来描述。
2. 在XML DB中注册Schema
把Schema数据模型在XML DB中注册,则XML DB就可根据XML Schema中所描述的数据规范对存储在库中的XML文档进行管理和解析,使得存放在XML DB的数据具有自描述性。一般注册需要以下几个步骤:
(1)调用PL/SQL的一个过程:
dbms_xmlschema.register_schema()把一个XML Schema文件注册到URL下。
(2)在注册XML Schema时,XML DB将根据格式创建一套XMLType表来存储这种类型的XML文档数据。XMLType表有两种方式:只创建一个XMLType表来存储所有的XML文档。把Schema中的全局元素分别映射为一个XMLType表,通过注册的Schema数据模型来实现对XML文档的分拆和组合。
(3)利用SQL/XML标准和 Xpath规范来实现对存储在XML DB的XML文档进行访问、修改、增加和删除等操作。
SQL/XML是国际信息技术委员会指定的一项标准,主要实现SQL和XMl的互操作性,另一方面可以把SqL的操作结果直接转换为XML文档。利用CeateXML(),extravalue(),extra(),updateXML来实现对XML的操作。
本图书管理信息系统中相关信息的XML Schema描述如下:
图书目录表
〈?xml version=″1.0″encoding=″gbzzh″>
″urn: schemas-microsoft-com:xml-data″
Xmlns:dt=″urn: schemas-microsoft-com: datatypes″>
< element Typename =“图书” 〉
< Element Type>
< Element Typename =“图书”content=″eltonly″ 〉
< element typename =“图书ID” 〉
< element type =“作者” 〉
< element type =“简介” 〉
< element type =“出版社” 〉
< element type =“图片” 〉
< element type =“定价” 〉
< element type =“出版日期” 〉
< element type =“种类” 〉
< Element Type >
< Element Typename =“图书ID”dt:type=″int″ 〉
< Element Typename =“书名”dt:type =″string″ 〉
< Element Typename =“作者”dt:type =″string″ 〉
< Element Typenamee=“简介”dt:type =″string″ 〉
< Element Typename =“出版社”dt:type =″string″ 〉
< Element Typename =“图片”dt:type =″string″ 〉
< Element Typename =“定价”dt:type =″float″ 〉
< Element Typename =“出版日期”dt:type =″datetime″ 〉
< Element Typename =“种类”dt:type =″string″ 〉
< Schema>
3.设计XML文档的数据表现形式XSL
根据界面需求和XMLSchema描述的数据规范,设计某类XML文档的表现形式格式XSL,然后作为一个模版保存在资料库中。以后在查询这一类型的XML文档时,可以选择按XML或者HTML格式输出数据,使得数据表现层的设计与数据层独立开来,便于其他系统共享。XML文档的图形组件如图1所示。
4.采用DOM或SAX来解析和处理XML文档
XML DB的主要任务是处理和创建XML文档,目前操作XML文档主要方法有DOM和SAX两种模型。通过这两种方法可以做到:数据结构的处理是基于XML Schema数据模型,而不必关心数据存储结构,数据处理是基于XML文档,数据传输具有跨平台性和标准性。XML文档的层次结构图如图2、3所示。
三、结语
图书管理信息系统开发实践表明,基于XML DB的开发模式与传统的开发模式相比具有如下优势:
(1)数据存储是基于XML Schema数据模型,不是由业务系统决定,这样不同业务系统直接的数据共享成为可能,为以后图书系统业务拓展奠定了基础。
(2)采用XML作为数据的载体,使得不同平台和业务系统数据变换成为可能,满足了数字图书馆发展的统一融合的需要
(3)采用XML文档存储数据,是系统数据格式的拓展,不会影响系统的存储结构。即使有新类型图书种类和格式,只需要定义XML Schema,不用修改数据库的数据结构。
参考文献:
[1] 李建中.用XML扩展三层模型.微计算机应用.2002;23(3)
[2]成玉哲等.基于XML数据模型的Web数据库查询.计算机应用.2002;22(3)
[3]李文敬.一种基于ASP生成动态XML的方法..微电脑与信息技术.2003;(1)
[4]景民昌等.基于XML的数字图书馆Web开发.计算机与现代化.2004;(6)
[5] 高静涛.国内“网络信息资源管理”研究的调查分析.图书情报工作.2005. 49(9)
[6] 孙 辉.基于XML的词典信息组织技术.情报学报.2005.24(1)
[关键词]XML DB 图书 管理信息系统 设计
当前,馆藏图书具有数量多、种类杂、管理难度大等特点,随着信息技术的不断发展和馆藏图书规模的不断扩大,开发数字图书馆已经成为提高图书信息服务质量的最为便捷和有效的途径。实现馆藏图书的数字化,就是要面向未来数字图书馆的发展,实现包括多媒体在内的各种信息数据、存储管理、查询和发布等的集成化,使这些信息得以在网络上传播,实现图书信息资源的共享,从而发挥图书信息的最大效用。传统基于关系数据库开发的图书管理信息系统,其核心思想是业务决定数据。这种方式存在内在的结构性矛盾,先是业务决定数据,一旦数据字典确定下来,就会限制业务,使业务与数据相互牵连,很难适应新的业务发展。研究表明,这种业务决定数据的模式是不恰当的,数据是对象的自身特性,是不依赖业务系统的。恰当的过程应该是先确定要处理对象的数据格式描述,然后在此基础上开展各种相适应的业务活动,XML DB技术能够克服运用关系数据库开发管理信息系统的缺陷,为开发图书管理信息系统提供了新的技术途径。
一、XML DB技术的基本思想
XML是(Extensible Markup Language,可扩展的标记语言)的缩写。XML是强大的元标志语言,是既能让机器理解,也能被人理解的“智能”语言,是发展自SGML的、具有旺盛生命力的、面向数据的语言。XML技术具有跨平台性、可拓展性、自描述性和结构化特征,便于异质系统间的信息互通,XML由W3C(国际互联网页联盟)统一制定,设计者可以为文档建立自己的标签(tags),这种标签不是固定的,不需要记忆,易于理解。因此可以根据图书管理信息系统的需要创建任何数量的图书专业标记。由于其中的每个项目都有自己的名字,而这个名字又与文档所描述的图书问题所涉及的某项具体内容密切相关。用XML编写的文档增强了文档的可读性,容易交流和维护。标识本身的含义与其所描述的信息相分离。它利用一个DTD规范来定义XML文件的语法、语句和数据结构的标准。XML带有一个XML语法分析器,它使用DTD规定一个文件是否规范,即包括正确定义的开始和结束标记。目前,图书行业已有专门的描述规范,有些已经形成标准。但要建立一个真正的图书信息管理系统,还必须提供信息的产生,存储、查询、提取、修改等功能,也就是需要一个完全能够支持XML技术的数据库管理系统,这样有产生了XML DB系统。
XML技术是由一系列可拓展标记语言相关的标准构成,主要包括:XML、XSL和XLINK。XML规定了数据的语法和语义结构。在XML之上的被称为RDF(资源描述框架),并为XML提供元数据编码定义,是XML文档的元数据;XSL(可拓展样式语言)是基于XML的格式化和可视化语言,包括两个部分:一是用于转换XML文档的方法,二是用于格式XML文档的方法;XLINK(可扩展链接语言),是基于XML的超文本链接标准。XML使用DTD和XML Schema来实现其模式定义。DTD通过一套标签的语法定义来描述XML文档中能够使用的标签、标签出现的顺序以及属性等;XML Schema采用XML语法结构,具有丰富的数据类型,能够用来定义新的数据类型,也可以在定义中使用命名空间(NameSpace)。命名空间是一个应用于XML文档的具有结构的元素名称和属性名称的集合。
XML DB技术能够满足开发图书管理信息系统的需要并可以提供如下支持:
1、提供了一个面向XML的数据类型来存储和管理XML文档。
2、能够依据提供的标准W3C Schema数据模型来创建和管理数据。
3、利用XML/SQL模型来实现对关系型数据表数据和XML的统一操作,实现同以往系统的兼容。
4、支持标准的协议来实现对XML文档的入库和出库,例如Http,FTP,WebDAV等,为数字图书馆提供开放式的接口。
目前XML DB形成两大阵营:XML-Enabled DBMS(XED)和Native XML DBMD(NXD).XED是在原由数据库基础上扩展了XML支持模块,完成XML数据和数据库之间的格式转换和传输。NXD采用的是层次数据存储模型,保持了XML文档的树型结构,不支持XML文档与关系数据库之间转换。 总之,XML DB可以实现对XML文档的存储和管理,提供多种XML文档内容的操作方法和性能优化方法,有利于图书管理信息系统的开发和应用。
二、基于XML DB技术的图书管理信息系统开发方法
XML DB提供了XML文档管理的底层服务,根据数据决定业务的新模式,在XML DB模式下开发图书管理系统与传统的方法有很大的不同,下面以基于ORACLE9I XML DB开发图书管理信息系统为例来加以说明。
1. 利用W3C Schema数据模型来描述图书资源数据格式。
首先要明确图书管理系统需要管理那些类型的图书资源,目前主要包括普通图书,电子文档、多媒体等。然后确定图书类型的形式和内容格式,需要用Schema数据模型来进行描述。目前可以用行业标准规范来描述。
2. 在XML DB中注册Schema
把Schema数据模型在XML DB中注册,则XML DB就可根据XML Schema中所描述的数据规范对存储在库中的XML文档进行管理和解析,使得存放在XML DB的数据具有自描述性。一般注册需要以下几个步骤:
(1)调用PL/SQL的一个过程:
dbms_xmlschema.register_schema()把一个XML Schema文件注册到URL下。
(2)在注册XML Schema时,XML DB将根据格式创建一套XMLType表来存储这种类型的XML文档数据。XMLType表有两种方式:只创建一个XMLType表来存储所有的XML文档。把Schema中的全局元素分别映射为一个XMLType表,通过注册的Schema数据模型来实现对XML文档的分拆和组合。
(3)利用SQL/XML标准和 Xpath规范来实现对存储在XML DB的XML文档进行访问、修改、增加和删除等操作。
SQL/XML是国际信息技术委员会指定的一项标准,主要实现SQL和XMl的互操作性,另一方面可以把SqL的操作结果直接转换为XML文档。利用CeateXML(),extravalue(),extra(),updateXML来实现对XML的操作。
本图书管理信息系统中相关信息的XML Schema描述如下:
图书目录表
〈?xml version=″1.0″encoding=″gbzzh″>
Xmlns:dt=″urn: schemas-microsoft-com: datatypes″>
< Element Type>
< Element Typename =“图书”content=″eltonly″ 〉
< element typename =“图书ID” 〉
< element type =“简介” 〉
< element type =“出版社” 〉
< element type =“图片” 〉
< element type =“定价” 〉
< element type =“出版日期” 〉
< element type =“种类” 〉
< Element Type >
< Element Typename =“图书ID”dt:type=″int″ 〉
< Element Typename =“书名”dt:type =″string″ 〉
< Element Typename =“作者”dt:type =″string″ 〉
< Element Typenamee=“简介”dt:type =″string″ 〉
< Element Typename =“出版社”dt:type =″string″ 〉
< Element Typename =“图片”dt:type =″string″ 〉
< Element Typename =“定价”dt:type =″float″ 〉
< Element Typename =“出版日期”dt:type =″datetime″ 〉
< Element Typename =“种类”dt:type =″string″ 〉
< Schema>
3.设计XML文档的数据表现形式XSL
根据界面需求和XMLSchema描述的数据规范,设计某类XML文档的表现形式格式XSL,然后作为一个模版保存在资料库中。以后在查询这一类型的XML文档时,可以选择按XML或者HTML格式输出数据,使得数据表现层的设计与数据层独立开来,便于其他系统共享。XML文档的图形组件如图1所示。
4.采用DOM或SAX来解析和处理XML文档
XML DB的主要任务是处理和创建XML文档,目前操作XML文档主要方法有DOM和SAX两种模型。通过这两种方法可以做到:数据结构的处理是基于XML Schema数据模型,而不必关心数据存储结构,数据处理是基于XML文档,数据传输具有跨平台性和标准性。XML文档的层次结构图如图2、3所示。
三、结语
图书管理信息系统开发实践表明,基于XML DB的开发模式与传统的开发模式相比具有如下优势:
(1)数据存储是基于XML Schema数据模型,不是由业务系统决定,这样不同业务系统直接的数据共享成为可能,为以后图书系统业务拓展奠定了基础。
(2)采用XML作为数据的载体,使得不同平台和业务系统数据变换成为可能,满足了数字图书馆发展的统一融合的需要
(3)采用XML文档存储数据,是系统数据格式的拓展,不会影响系统的存储结构。即使有新类型图书种类和格式,只需要定义XML Schema,不用修改数据库的数据结构。
参考文献:
[1] 李建中.用XML扩展三层模型.微计算机应用.2002;23(3)
[2]成玉哲等.基于XML数据模型的Web数据库查询.计算机应用.2002;22(3)
[3]李文敬.一种基于ASP生成动态XML的方法..微电脑与信息技术.2003;(1)
[4]景民昌等.基于XML的数字图书馆Web开发.计算机与现代化.2004;(6)
[5] 高静涛.国内“网络信息资源管理”研究的调查分析.图书情报工作.2005. 49(9)
[6] 孙 辉.基于XML的词典信息组织技术.情报学报.2005.24(1)