论文部分内容阅读
自上个世纪七十年代关系数据模型的提出开始,关系数据的发展突飞猛进,逐步应用到各个行业。随着信息化和大数据时代的开启,由庞大数据量带来信息效益的同时,也产生了许多负面影响,如脏数据的增多,从而寻找提高数据质量的方法成为亟需解决的难题。如何在数据生产过程中,加强监督管理,控制数据质量,成为数据生产者和研究者钻研的课题。通过分析,矿产资源规划数据具有数据量大、专业性强和时效性严格等特性。本文以西安市矿产资源规划关系数据库为研究对象,建立关系模型,设计约束规则,构建数据质量的评估指标体系,研究约束规则下的质量评估算法;在此基础上,制定基于约束规则的质量控制模型和质量评价模型,探讨关系数据质量评价方法的问题;初步完成该关系数据质量检查系统的设计,提出设计思路和实现模型。本文在对关系数据质量控制进行研究时,首先从不同角度对关系数据进行规范性探索。文中通过定义约束规则,反映该关系数据库具备完整性、一致性、准确性和时效性四个质量特性,解析了不同层次的数据质量问题,也表明了本文研究数据质量问题的切入点。其次以约束规则为基础建立数据质量评估指标,定义评估算法,以及建立质量控制模型和质量评价模型等,丰富数据质量控制研究的内容,体现关系数据质量控制研究的系统性。同时本文为深化数据质量控制的研究,提出对关系数据质量评价方法的思考。