基于tableau的数据记录匹配及一致性研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:averyhut
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据质量已被公认为是数据管理的首要问题之一。针对数据质量管理领域的数据记录不匹配及不一致问题,本文分别从记录匹配检测及不一致修复两个角度出发,提出了基于CON模型的记录匹配方法和基于tableau的自动检测及修复不一致数据库方法。同时,在所提理论的基础上,以eclipse为实验开发平台,将上述算法应用到实验中,实验结果表明,这些方法对于验证数据记录匹配及修复不一致数据库是正确的及有效的。本文的主要研究成果概括为以下三个方面:(1)提出一种基于局部CON模型的记录匹配方法。该方法利用关联规则发现算法挖掘匹配依赖,将匹配依赖和数据实例同时作为改进型tableau的输入,检测匹配得出结果。理论分析和实验结果表明该方法能快速识别出分布式记录匹配情况,且不需要人工参与,效率有非常明显的提高。(2)以不一致作为CFDs的违反情况,提出一种自动检测及修复不一致数据库的BCFDAR算法,并从理论上证明了算法是可终止的。实验结果表明,该方法能有效地修复不一致数据库,而且CFDs体现出比传统的FDs更高的准确性,并加入优化算法,使得检测修复过程更加高效。(3)利用分支封闭值修复数据库方法,结合tableau分析法的开放和封闭推理标准,以开放公式树TP(IC∪r)(?)分支为基础,为公式树TP(IC∪r)中的每个结点引入一个结点封闭值,通过计算该值来选择分支进行开放修复,并对该过程进行了逻辑证明。最后,对于一致性应答结果的逻辑特征给予了证明。
其他文献
字符串匹配问题是文本信息处理领域中的一门非常重要的课题。随着网络和信息技术高速发展,极度膨胀的信息量,使得对信息处理的性能和效率要求越来越高,在某种程度上,字符串匹
自动布图技术在航空航天等领域应用广泛,准确快速的自动布图系统可以极大的提高航天设计人员的工作效率。本文针对航天自动布图工作中实际遇到的潜通路检测问题及电缆网研制问
分子动力学(Molecular Dynamics)是在原子级模拟固态、液态物质的主要计算方法,用于研究物质微观结构、热力学性质及平衡输运性质等,广泛应用于物理科学、材料科学、生命科学
图像去噪是图像处理的经典主题。我们的目标是从噪声污染的图像中还原出一个干净的图像。几十年来,发表了很多处理噪声的算法,去噪性能一直稳步提高。这其中的大多数针对的是常
当今社会,互联网中所包含的种类繁多内容丰富的知识资源,为我们日常学习和工作中面对问题时寻求帮助和获取信息提供了很大的方便。目前的Google和百度等搜索引擎是人们从网络
随着物联网技术的深入发展,无线传感器网络(Wireless Sensor Network,WSN)和Internet的互联问题逐渐凸显,如何无缝地实现这两种网络的互联互通成为应用中的技术瓶颈。由于WSN
人脸识别作为生物特征识别的一个重要分支,近年来受到广大研究者的关注,取得了较快的发展。在一些实际应用中,每人只能获得一张图片作为训练样本,但大多数人脸识别方法在单个训练
半个世纪以来,随着研究的不断深入,已有多种模型用于基因调控网络的构建,包括布尔网络模型、贝叶斯网络模型、微分方程模型等,并取得了一些成果。20世纪90年代,基因芯片等高通量生
增强现实是将计算机生成的虚拟信息与真实世界的叠加,而全景视频是将拍摄到的视频拼接后可任意角度拖动观看的动态视频。在一些受到保护且不便让用户进入的场景(如文物古迹、
一直以来,自动语义分析是自然语言理解的主要目标之一,然而由于深层语义分析的复杂性,人们目前更关心浅层语义分析,一种简化的语义分析形式,它只分析与句子中谓词有关成分的