基于数据仓库体系结构的OLAP和数据挖掘技术的研究与应用

被引量 : 0次 | 上传用户:cysyzcws
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,数据仓库系统在电信业、银行业、零售业、政府机关等都有广泛的应用。数据仓库系统数据量迅速增长和对数据仓库系统需求的发展,对当代数据仓库系统有了新的要求,因此对数据仓库系统及其相关技术的研究有着重要的现实意义。本文通过对实现数据仓库系统的数据仓库、OLAP、数据挖掘三方面技术进行研究,最后以某市公安信息系统为例,设计实现了公安数据仓库系统。在数据仓库设计技术方面,主要包括实时数据仓库架构的设计和维护数据仓库中缓慢变化维的代理键的研究。实验表明:基于系统数据日志的实时ETL算法和混合型实时数据仓库架构,实现了实时数据仓库与业务系统数据零延时的要求;在数据仓库中,代理键自增序列算法的使用,除了可以维护缓慢变化维,还可以极大的缩减数据仓库的存储容量。在OLAP研究方面,主要研究了OLAP的实现技术与数据存储技术,提出了MOLAP基于Cuboid的数据立方体压缩存储算法,和基于该存储结构的解压缩算法和语义查询算法。实验表明:该算法在压缩稀疏数据的同时,改进了以往多维数组压缩算法对非稀疏数据的敏感性,解决了索引维信息冗余问题。在数据挖掘研究方面,介绍了数据挖掘在数据仓库中的应用,提出最大模糊后验假设,对朴素贝叶斯分类算法进行改进,并与OLAP结合,设计了基于数据立方体的改进朴素贝叶斯分类算法,实验通过对模糊系数的调整,明显提高了朴素贝叶斯分类算法的准确率。在公安数据仓库系统设计方面,结合了公安现有的信息管理系统、全国刑侦联查系统数据接口,设计实现了行政治安和全国刑事侦查两个数据集市组成的实时数据仓库系统。
其他文献
本文对公报行政案例的法律效力进行探讨,在模式选择上试图寻找出一个既能发挥公报案例实效又能符合我国具体法治环境的路径。文章共分为四章,第一章主要阐述对最高人民法院公
本文通过对三年流通借阅数据的统计分析,探究体育院校大学生普遍的阅读倾向,并从宣传策划打造品牌活动、优化读者阅读环境、协同联动学校其他部门、不断创新阅读推广活动内容
本文在历史唯物主义和辩证唯物主义史观的指导下,以海洋史学为研究构架,综合运用海洋科学及管理科学的研究概念和方法,对中国古代的海洋管理进行整体研究,找寻海洋史学下的中
随着人们对彩色图像在跨媒介复制再现过程中产生失真原因的理解加深,色域映射技术已经成为色彩管理领域内的研究热点。色域映射技术可以被分为两类,一类是将大色域映射到小色
近年来,人民币现金在我国周边国家跨境流动逐渐形成相当规模,且人民币跨境流动的动机日趋复杂,从简单的交易需求扩大到了交易、投机、价值储备等多重动机,人民币跨境流动的途
深圳市是中国改革开放的前沿,是全国唯一100%城市化的城市,下辖9个行政区和1个新区,总面积1997平方公里,截至2018年末,常住人口为1302万,实际管理人口超过2000万。深圳市作为
<正>残疾人就业问题得到了世界各国的广泛关注,自20世纪以来,主要政策包括两种,以反歧视法为基础的"机会平等法"和以就业配额制度为基础的"就业配法"。美国在1990年率先采用
近几十年来,随着科技的进步,桥梁结构的发展也取得了举世瞩目的成就,而桥梁试验研究对于推动和发展桥梁结构设计计算理论、解决生产实践中出现的难题起到了重要的作用。为保
目的评价有晶状体眼后房型人工晶状体(ICL)植入术矫正高度近视及散光患者术后的视觉质量。方法收集2017年1至12月在湖南省人民医院眼科接受ICL植入术治疗的近视眼和散光患者3
护理专业承诺是护理人员(包括在校护理专业学生和在职护士)认同并接纳护理工作,愿意终其一生为促进护理事业的发展和增进全人类健康的意愿与行动。现今,由于护理专业存在高付