原生XML数据库存储模型的研究

来源 :山西大学 | 被引量 : 1次 | 上传用户:liongliong518
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术的发展,XML在各个领域的应用越来越频繁,于是以XML格式表示的数据大批量的出现,为了有效地管理这些数据,原生XML数据库应用而生。这是一种根据XML数据的特点设计的,专门用来对其进行管理的数据库。这种数据库之所以被称为“原生”方式,是因为它的内部存储保持了XML数据的树形结构,使XML相关的技术可以不经任何修改就应用到这种数据库系统中,如XPath查询语言、DOM解析器、XUpdate更新操作等。这种方式在对XML数据进行操作管理时表现的更为流畅,效率也比较高。像所有传统的数据库一样,存储模型也是这种系统实现所有功能的基础,所以对原生XML数据库进行这方面的研究是很有价值的。本文首先通过国内外具有代表性的两个产品介绍了原生XML数据库存储技术的研究现状,然后给出了XML数据的特点及应用,接着介绍了原生XML数据库的定义、结构和特性等基础知识。文中详细分析了现有的原生XML数据库的存储技术,包括存储粒度及顺序的划分、存储方案的分类、及在不同的底层存储格式上采用的存储模型,重点是压缩模型的分析。文中给出了一个实例数据库产品Xindice中的与存储有关的一部分代码,分析出它采用的逻辑存储结构:符号表和压缩DOM树,这种逻辑结构实现的基础是基于压缩文件的存储格式,它在保持XML文档的树形结构的同时,实现了一定的压缩比,通过分析这个存储模型,我们提出一种基于XMLSchema产生符号表的改进方案,在某种程度上,这个改进能减少数据库中符号表的建立时间。
其他文献
该项目主要目的是研究宽幅彩色喷墨绘图机的关键技术,最终完成一台彩色喷墨绘图机性能样机,并通过测试验证解决关键技术的可行性,改进定型后投入生产.该设计负责设计和开发绘
分布式组件对象技术的出现为网络计算平台上软件的开发提供了强有力的解决方案。目前,分布式对象技术已经成为建立服务应用框架和软件构件的核心技术,在开发大型分布式应用系统
动态存储管理是计算机系统必不可少的资源管理手段之一。现有的动态存储分配算法存在着效率不高、时间开销较大等缺点。 本文在自主开发操作系统这个教学课题的基础上,深入
知识推理是智能决策支持系统中的核心,即根据所获得的信息通过数据分析、推理,从而产生合理的决策规则形成有用知识的过程。粗集理论(Rough Set)作为智能信息处理技术的一个新成
论文在描述了任务和研究目标之后,首先对课题中所涉及到的背景知识进行了阐述.由于该课题采用TMN(电信管理网络)关于网管的规范和方法论进行设计和实现,在论文的第二章着重介
UMTS系统是第三代移动通信系统(3G)的代表之一,它将分组交换引入无线通信系统,为用户提供多种数据服务.对于分组域的移动管理,UMTS的核心网采用了GPRS技术.由于3G的发展方向
本文首先通过介绍面向对象数据库的产生背景,发展和现状,比较了其和传统关系型数据库在基本特性、开发方式、适用领域、性能上的区别,指出了面向对象数据库更合适用于有数据类型
本文把P2P模型和基于本体 (Ontology) 的形式化知识管理方法结合起来,用动态演变的局部本体(Local Ontology)来跟踪单个用户的需求变化,用所有局部本体的融合和映射(Merging an
数字水印技术,是指在数字化的多媒体信息中嵌入某种不易察觉的信号,在需要的时候可通过特定的算法,将此信号提出,用以确认身份的技术. 该文介绍了数字水印系统的嵌入与检测模
基于位置服务的空间查询在交通导航、救援服务以及数字战场等诸多领域有着广泛的应用前景。近年来,随着无线通信和全球定位系统(Global Positioning System,GPS)定位技术的发