Web资源组织与服务性能研究

来源 :重庆大学 | 被引量 : 7次 | 上传用户:caoheng19
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet技术的飞速发展以及应用的日益普及,Web上存储的信息量正以指数级增长(仅HTML文件就数以亿计)。虽然目前Web搜索引擎数以百计,新的Web个性化服务系统、新的Web数据模型和查询语言在不断涌现,但由于Web资源所具有的分布性、开放性和异构性等特点,使得Web信息的有效组织以及快速准确地获取日益困难,人们正面临所谓“RichDataPoorInformation”的尴尬局面。 论文方向为Web数据管理,以电子商务、电子政务、数字图书馆和远程教育的应用基础为研究背景。通过分析目前Web数据管理中资源组织(数据模型,资源建设,异构资源集成)与信息访问(资源浏览效率,信息检索与信息重构)方面存在的不足,提出了新的Web资源表示模型,并对其在Web资源管理中的应用进行了深入的研究。通过新模型的提出和进行一系列的技术改进,能够使Web数据管理的整体性能得到一定改善。 论文主要创新点和研究成果如下:(1)针对Web资源的传统表示方法在资源建设、数据冗余和数据一致性维护等方面存在的不足,提出了将具体数据内容和数据组织结构相分离的Web资源虚拟表示模型,较好地解决了上述不足。新模型不仅支持数据级的信息共享、不需修改资源设计即能够使Web资源随内容的改变而动态更新,而且还可以作为异构Web资源集成的公共数据模型。 (2)在虚拟表示模型基础上,通过引入模块化标记、ETG嫁接操作和剪枝操作等概念,提出了Web资源(网页资源和XML资源)的模块化设计方法。该技术支持设计级的信息共享,允许设计静态和动态公共信息模块,并在Web资源设计中进行引用,具有使设计问题简化、减少设计冗余、便于资源设计的快速更新和一致性维护等特点。总之,该技术在Web资源建设中所起作用,达到了类似于模块化设计技术在程序设计中起到的作用。 (3)在虚拟表示模型基础上,通过分析借鉴当前异构数据源集成和异构系统集成技术,提出了一种异构Web资源集成系统框架。在包装器的设计中,采用了将数据仓库方法与虚拟方法相结合的技术思想。与纯粹采用数据仓库方法的集成系统相比,该系统具有减少数据冗余、数据一致性维护和动态更新好的特点。而与采用虚拟方法侧重查询功能包装的集成系统相比,该系统具有不涉及复杂的查询分解与转换、包装器设计简化、易于加入新的数据源等特点。 (4)在虚拟表示模型基础上,通过引入ETG操作和ETG重构操作,提出了一种基于资源内部标记结构和语义的Web信息抽取与重组技术,并给出了作为用户操作接口的标记查询语言TagSQL。该技术具有操作功能强、语言使用方便、信息抽取灵活、能够基于多资源进行信息重组等特点,是对基于内容的Web信息检索系统功能的补充和完善。该技术能够扩展应用到基于虚拟表示模型的异构Web资源集成系统上。 (5)在虚拟表示模型基础上,通过引入内容模块概念,提出了Web资源快速访问技术。通过查看资源摘要信息和动态指定内容模块参数,可使用户在资源访问过程中减少传输和浏览无关资源和资源中的无关信息,提高资源访问效率。该技术能够扩展应用到基于虚拟表示模型的异构Web资源集成系统上。
其他文献
信息系统领域传统的数据库技术是以单一的数据资源为中心,主要进行事务处理的操作型数据处理工作,对于决策分析等分析性工作的功能是有限的,只能提供预先定义好的简单的统计
本课题的研究重点就是在基于无线网络的警务移动办公业务这一新的应用领域中,如何区分登录用户身份的真假、如何保证对登录用户的访问控制,防止越权操作、内部信息以及个人隐
离散小波变换(Discrete Wavelet Transform)因其良好的多分辨率分析特性和时频域局部特性,被广泛地应用于信号分析、图像编码压缩、模式识别以及机器视觉等各领域。目前已有的
识别文本中时间关系是深层语义理解的基础,是问答系统、信息抽取和文本摘要等诸多应用的关键。所谓时间关系,就是文本中事件之间、时间之间、事件和时间之间的时序关系。目前
图象变形作为基于图象绘制技术(IBR)的一个分支,已在虚拟环境(VE)建模的许多场合得到运用。本文首先回顾了VE建模的三种主要途径,系统的综述了各种图象变形方法的原理与实现。
随着医疗大数据时代的来临,电子病历的知识挖掘和利用受到越来越多的关注。电子病历本身是一种半结构化的数据,其结构化的内容为计算机自动抽取和分析提供了便利,同时,非结构
数字水印是近年来在信息安全领域兴起的保护知识产权的新方法。它是在宿主数据中嵌入特定的信息并以此对宿主数据进行监测和追踪。本文提出了一个新的水印算法应用于静态图像
在Internet的发展过程中,数据库技术得到了广泛的应用,随着商务网站之间电子商务的发展,异构数据库间的数据交互日益频繁,新兴的可扩展标记语言逐步展现了其在数据存储、数据交换
传统的Intranet安全防御体系构建在防火墙、入侵检测以及各种认证技术之上,理论上能够达到相当高程度的安全控制.然而,由于在实际应用中防火墙、入侵检测系统往往难以配置,所
Web GIS是当今GIS领域的制高点,集中体现了分布式计算、组件式软件体系结构等多项先进技术,是地理信息系统的发展趋势。本文从理论和实践两方面对该领域作了较深入的研究。首先