不确定数据流上SKYLINE查询算法研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:nuclear01
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Skyline查询常用在数据挖掘和决策支持系统中,用于数据的多条件优化。但早期有关skyline查询的研究仅限于确定数据集,不确定数据流上skyline计算问题刚刚起步。而且,不同用户所关注的维度也可能不尽相同,使得不确定数据流上的skyline查询变得更加复杂,已有算法很难满足实际需求。本文将不确定数据流上概率skyline查询作为研究重点,具体工作包括以下几个方面:首先,分析了当前不确定数据流全空间上skyline查询算法SOPDS,并对其作出进一步优化。一方面,通过减少选择补偿次数和支配比较次数缩短算法的计算时间;另一方面,通过延迟更新对象被支配的概率来提高算法的查询效率。其次,根据不同用户查询维度可能不同的特点,设计了不确定数据流子空间上概率skyline查询算法PSSQ。PSSQ算法采用规则网格索引结构,通过格间的三种支配关系来减少对象间的比较次数,并巧妙地利用了格在全空间与各子空间上的概率上下界关系,从而节约子空间skyline计算的时间开销。最后,为保证用户实时观察查询结果,设计了不确定数据流子空间上连续概率skyline查询算法CPSQS。CPSQS算法是对PSSQ的扩展,其初始化模块与PSSQ算法基本一致。在CPSQS算法的维护阶段,通过将格划分为影响区域和自由区域来减少算法的支配比较次数,从而减少算法的维护时间。本文对不确定数据流上概率skyline查询算法进行的研究,在用户偏好系统、多条件决策系统以及数据挖掘与可视化中具有一定的现实意义。在不确定数据管理越来越受重视的今天,本文的工作可以促进skyline查询在不确定数据环境下的应用。
其他文献
近年来,随着计算机和信息技术的飞速发展,信息技术已融入人们生产、生活的各个方面,信息系统的安全性日益成为人们关注的焦点。同时,传统信息安全技术的弱点也逐渐暴露出来,
网络技术的飞速发展使个体之间信息的交换越来越频繁、音频、视频等数字产品通过网络传播和其他媒介被用户获得。但是信息安全的问题也随之而来,数字产品被人们任意的复制、
随着互联网技术在21世纪的迅速普及和发展,互联网对于社会经济的发展产生了深远的意义,人们的生活越来越离不开互联网。近年来,电子商务的出现,通过网络进行的电子商务交易行为更
自然场景的时变过程模拟一直都是计算机图形学领域的重点内容之一,而建筑物场景的时变效应模拟则是其中一个重要的组成部分。建筑物场景时变效应模拟技术涉及计算机图形学、虚
现实世界中众多的复杂系统都可以抽象的表示为复杂网络,而社区结构是复杂网络最显著的结构特征。从某种程度而言,整个网络的功能往往取决于社区间的相互作用。通过跟踪社区结构
随着计算机的普及和计算机网络技术的不断发展,单个计算机或局域网内部之间的资源共享已经难以满足现代信息通信需求。同时,计算机应用的领域不断扩张,迫切的需要一种能够在
笔段网格汉字字形形式化描述方法用预先定义好长度、方向的直线段——笔段作为描述字形的基元,来统一描述一切可能汉字字形骨架异同;描述的字形有效基元量少,字形比对计算效率高
贝叶斯网络是继模糊逻辑、可信度方法和神经网络等方法之后提出的不确定知识表示模型,是研究不确定性问题的重要方法之一。目前,贝叶斯网络参数学习采用的方法主要是精确计算和
随着计算机软硬件技术和语音识别技术的发展,基于语音识别技术的计算机辅助发音训练系统(CAPT系统)在教育领域的应用越来越广泛,而如何为用户的口语发音提供准确有效的反馈是当
真实感自然场景模拟技术一直以来都是计算机图形学领域的热点研究问题,而真实感雪场景模拟技术则是其中一个重要的组成部分。雪场景模拟技术的研究不仅在计算机图形学和虚拟现