不确定数据索引及其范围查询处理技术研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:liug1001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,随着数据采集技术的日益丰富和迅猛发展,人们可以利用的数据资源急剧增加,对海量数据进行科学组织、存储和管理的数据库技术得到了广泛的应用。另外,随着人们对客观世界认识的逐步深入,现实应用中普遍存在的数据不确定性开始得到业界的重视。在不确定数据库中加入索引可以极大的提高数据的查询效率,因此,如何引入有效的索引机制来管理不确定数据并且高效的支持查询操作成了数据库领域的研究热点。虽然在传统数据库领域中范围查询得到了系统的研究,但是由于不确定数据一般都带有概率,传统的范围查询算法都不能直接应用于不确定数据库。为了解决这个问题,本文提出了两种不同的索引算法,可以有效的支持基于不确定数据的概率阈值查询。本文的主要工作概括如下:(1)定义了边界概率的概念并提出了一种基于边界概率的索引算法。利用在结点中附加的边界概率信息,设计了一组快速计算查询区域与不确定区域相交部分的概率上界和下界的算法,通过对不确定对象进行过滤,避免了直接计算出现概率。该索引算法是完全动态的,可以实现不确定对象的任意插入和删除,而且对不确定对象所服从的概率密度函数的类型没有限制。实验结果表明,该索引算法是一种高效的索引算法,在系统I/O、CPU时间等性能上优于其他不确定数据索引算法。(2)给出了划分的规则并提出了一种基于划分的索引算法。该算法的基本思想是首先将不确定对象的不确定区域划分成若干元组,接着将MBR接近的元组重新合并成新的单元,最后利用规则过滤,从而减少了落入候选集中的不确定对象,提高了查询效率。该索引算法可以对服从任意概率密度函数的不确定对象进行查询,而且对于查询区域的大小和形状是不敏感的。实验结果表明,较之其他不确定数据索引算法,该索引算法具有更好的查询处理性能。
其他文献
业务流程经常会涉及到多个服务之间的协作交互,交互过程中不可避免地呈现动态多变的特征,因而对流程运行状况的监控成为实际流程执行过程中不可缺少的功能。而从监控的角度来
随着图形处理器(GPU)技术快速发展,GPU已经具有高度的并行性以及灵活的可编程性,这使得GPU在通用计算和并行处理领域得到了广泛研究和应用。GPU作为一种新的计算主体,具有深
随着下一代网络NGN(Next Generation Network)的发展和VOIP(Voice over Internet Protocol)技术的成熟,人们对通信业务的需求不只是简单的语音通话,而是语音、视频、资讯、娱
随着网络技术和数据库技术的快速发展和广泛应用,电子商务逐渐兴起并蓬勃发展起来,随着企业间竞争的加剧,电子商务网站如果想获得持续发展,就必须运用电子商务的在企业产生了
随着图像数字化技术的发展,尤其是互联网技术的快速发展和普及应用,人们在各个专业领域和日常生活中所接触到的图像数量已经达到海量化的规模,其内容也更加呈现多样化,这对有
当前,全国电信业全业务运营已进入实施阶段。各电信企业在完成重组、构建竞争新优势的同时,更把目光瞄准未来具有巨大发展潜力的一些新兴战略市场。面向家庭客户提供个性化的
随着社会需求的日益增长和科技水平的日益提高,电话交换技术正处于快速的发展和变革之中。近年来计算机和通信技术都得到了迅猛发展,一场以数字化为核心的技术革命正在改变人