基于XPath查询的XML文档过滤

来源 :复旦大学 | 被引量 : 0次 | 上传用户：zjkghost10

【摘要】

：

本文对XML文档过滤技术进行了系统地研究：从一个大的XPath表达式集合中寻找与输入的XML文档匹配的XPath表达式子集的一些关键技术，包含XML文档索引、XPath查询索引、XPath查询

【作者】

：

苏明柿

【机构】

：

复旦大学

【出处】

：

复旦大学

【发表日期】

：

2005年期

【关键词】

：

增量维护 XML文档文档过滤 XPath查询索引结构路径表达式

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文对XML文档过滤技术进行了系统地研究：从一个大的XPath表达式集合中寻找与输入的XML文档匹配的XPath表达式子集的一些关键技术，包含XML文档索引、XPath查询索引、XPath查询索引的增量维护和文档过滤算法等。本文的主要研究成果有：采用对XML文档构造索引的方法，提出了一种新的XML文档索引结构，以增强对较大的XML文档和XPath查询中的祖先-后代关系“∥”的支持。针对路径表达式中存在的大量共享结构，我们介绍了一种基于共享前缀树的XPath查询索引结构，并对YFilter匹配算法进行改进，以解决XPath查询的结构匹配问题；同时，通过该索引结构可以很容易地对XPath查询进行增量维护，这对有效性和可扩展性要求较高的XML文档过滤系统来说无疑是非常重要的。提出了一种新的方法以支持对XPath查询谓词的匹配。将每个XPath查询分解为多个查询分支，并将所有XPath查询的查询分支构造成一个共享前缀树与输入的XML文档匹配，然后对匹配算法返回的结果进行处理以得出与XML文档匹配的所有XPath查询。

其他文献

IPv4和IPv6转换网关的研究及IPv6在校园网中的实现

本文分析比较了IPv4和IPv6两种协议的异同点，介绍了IPv6新协议的特点及一些技术规范。并着重研究从IPv4向IPv6过渡的问题。重点分析了目前几种比较成熟的技术：双协议栈技术、隧

学位

IPv4IPv6NAPT-PT转换网关

基于神经网络的阵型策略在线学习研究及应用

RoboCup仿真2D比赛过程需要球队间的整体高效的合作及多个智能体之间默契配合，如阵型策略的调节，才能赢得比赛胜利。但由于通讯的限制，智能体很难在动态实时的比赛环境中得到足

学位

RoboCup仿真2D神经网络在线学习阵型策略在线教练

航海视景仿真中若干关键技术的研究及实现

对地球上各种自然现象和景物的虚拟仿真早已经成为计算机仿真领域的热点和难点，海洋占据地球总表面积的70%以上，人类在海洋中从事着各种各样的经济及军事活动，是人类活动的重要

学位

渲染到纹理光照模型粒子系统投影网格

基于CORBA的分布式关联规则挖掘系统的研究和实现

数据挖掘是指从大型数据库或数据仓库中提取隐含的、先前未知的、对决策有潜在价值的知识和规则。它是人工智能和数据库发展相结合的产物,是目前国际上数据库和信息决策系统

学位

数据挖掘分布式数据库关联规则FDM算法CORBA规范

无损图像压缩技术的研究与应用

数据压缩技术已成为当今通信、广播、存储和多媒体娱乐等领域的一项必不可少的关键技术。但在安全、医药等几个特殊领域,由于对图像数据要求苛刻,压缩、解压缩过程不能有丝毫

学位

数字图像处理图像编码数据压缩无损压缩有损压缩

藏文字处理系统的研究与实现

藏文字处理是计算机完成藏字的输入、处理和输出的全过程，是研究藏文信息的技术基础。目前，国内外虽有几个藏文字处理系统，但还没有一个可以输入所有藏字的系统。本论文旨在研究

学位

藏文字处理系统工程心理学键位布局OpenType藏文字库藏文输入系统

一种面向网络并行模拟的多级图划分算法

本文详细介绍了国际上目前在这三个步骤上提出的多种算法，并针对这三个步骤提出了自己的改进算法。文中一共提出了六种改进算法，包括塌缩步骤中的关键顶点塌缩算法和顶点团

学位

图划分多级划分图塌缩初始划分分割线优化

驱动发生器测控系统的研究与开发

根据单片微机系统的发展趋势及用户对驱动器测控系统的需求，在对系统功能，技术指标、性价比等方面进行了可行性分析之后，提出了一套能够满足用户要求的系统设计方案。本文针对系

学位

C8051F020单片机驱动器测控系统SMBus通讯抗干扰

基于两层隐马尔可夫模型的可视语音合成方法研究

多媒体技术的发展使人类获取、处理信息的手段发生了质的飞跃，人机交互的方式越来越便捷、有效、人性化。多通道信息融合的研究正是适应人机交互这一要求提出来的，而对人类交流

学位

可视语音合成多媒体技术隐马尔可夫模型

基于多尺度小波分析的汉字字体识别研究

不同汉字字体都有其视觉差异,这种视觉差异要比不同字符之间的差异小得多,小波分析要比Gabor变换更加符合研究信号不同位置局部性质的要求,小波变换能够在不同的分辨率下对信

学位

字体识别BP网络网格特征小波分析汉字字体

基于XPath查询的XML文档过滤

与本文相关的学术论文