大规模二维散点图矩阵的快速可视化技术

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:danhun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,数据挖掘技术获得了人们越来越多的重视,因而成为一门新兴的学科,人们利用数据挖掘技术从海量的数据中寻找有用的信息,同时为了使数据挖掘系统发现知识的过程和结果展示易于理解和在发现知识的过程中实现人机交互,我们就要利用和发展数据的可视化方法。散点图矩阵可视化方法作为数据可视化的一种手段能够简明直观以图形形式表示数据库中的数据,也因其有效的降维作用,成为多维数据可视化的有效方法之一,因此目前主流的数据挖掘软件都包含散点图矩阵可视化方法。但当待可视化数据规模增大时,目前的可视化软件中的散点图矩阵可视化功能普遍存在速度慢,可视化效果不清晰以及缺乏与用户的交互性等缺点,因此这是本文着重要解决的问题。本文针对目前现有的一些数据挖掘系统中可视化功能所存在的一些问题入手,诸如:在数据量增大时,可视化的速度非常的慢,以及可视化效果的繁杂不清晰,同时缺少与用户的交互性等。针对这些问题本文设计了N-Box Tree的数据结构,来支持数据的快速可视化,以及增加与用户的交互性。本文详细的介绍了N-Box Tree的数据结构的原理、思想、构造方法、相关操作、以及将N-Box Tree的数据结构应用在散点图矩阵的可视化方法上,该数据结构可以方便的提高数据可视化的速度与可视化过程的交互性和效率。并对N-Box Tree的数据结构的应用效果进行试验分析,实验证明N-Box Tree的数据结构可以提高可视化的速度与交互性。同时本文提出了针对N-Box Tree的数据结构的一些优化方法,包括利用抽样策略与缓存策略,并取得了良好的实验效果。最后基于以上的研究成果,本文基于AIBox智能数据挖掘平台实现了一个数据可视化原型系统,包括数据输入,数据预处理,数据映射,数据可视化,用户交互模块等,为数据挖掘系统的设计提供了一个辅助模块。
其他文献
教务管理是高等学校教育管理过程中重要的组成部分,科学合理的管理流程不仅能提高教务管理人员的工作效率,而且能够提高整个高校教育管理的工作质量和效率。本论文以辽宁石油
随着无线通信和移动计算技术的发展,人们对无线宽带接入提出了更高的要求。无线网络能够实现高容量、高速率的Internet接入,是未来无线通信逐渐替代有线网络通信的先决条件,
伴随着计算机技术的不断发展,互联网日趋普及,网络上信息数量不断扩大,用户可以更自由的获取信息,这满足了用户的信息需求。但是随着网络上信息的大幅增长,用户在有限的时间
谓词加密算法是可搜索加密算法领域的研究热点,提供了外包数据的密文查询功能。谓词加密算法中假设外包方(例如云服务商)会正确地执行查询算法,并将真实的查询结果返回给用户
互联网上存在海量的网络资源,如何有效利用、开发这些资源是当前的一个研究热点问题。随着企业竞争越来越激烈,诸多业务要求在较短时间内汇聚网络上的网络资源以求解业务问题
信息化是当今社会发展的趋势,随着计算机、通讯技术与医疗影像科学在医疗行业的进一步应用,我国医院信息化管理进程得到不断深入和拓展。国内部分医院已经建立起了独立的医院
代码变形技术是软件保护技术的关键技术之一,属于针对逆向工程与加密技术互补的安全分支。代码变形技术按照类型分为词法变形、数据变形和控制流变形。本文主要研究了基于控
随着互联网的不断发展,在线数据库的数量不断增多,DeepWeb模式集成的重要科学研究意义和显著的工程应用价值就凸现出来,但是由于这些数据库在地理上分布、管理上自治、模式上
随着文本数据的急剧增长,文本聚类方法已成为大家关注的热点。文本数据常用文档-词矩阵表示,基于这种表示方法大多数传统的聚类算法采用单向聚类方法,即要么只是对文档进行聚
自动图像标注是基于内容图像检索中重要而具有挑战性的工作,它可以在一定程度上解决基于内容图像检索中存在的语义鸿沟问题。如果能实现自动图像标注,那么现有的图像检索问题