【摘 要】
:
随着现代数据库和网络技术的迅速发展,人们必须面对大量的数据,为了从这些原始数据中发现隐含的,有价值的信息,我们需要高效的数据处理方法,数据挖掘正是为了迎合这种需要而
论文部分内容阅读
随着现代数据库和网络技术的迅速发展,人们必须面对大量的数据,为了从这些原始数据中发现隐含的,有价值的信息,我们需要高效的数据处理方法,数据挖掘正是为了迎合这种需要而产生并迅速发展起来的一种新的数据处理技术。聚类分析是数据挖掘的一个重要组成部分,随着数据挖掘得到越来越多的应用,聚类分析也得到了越来越多的关注,目前已有许多成熟的聚类算法,这些算法被广泛应用于各个相关领域中,如商业市场分析、生物工程研究、图形图像处理、模式识别、Web检索领域等等。 文中首先介绍了数据挖掘和聚类分析的一些相关理论以及国内外的研究现状,指出了聚类分析中急待解决的问题,然后分析了聚类方法中基于划分的、基于层次的、基于密度的、基于网格的和基于模型的方法,并对其中的一些典型算法进行了分析。本文主要是针对高维稀疏数据聚类中的异常值处理问题,目前这方面的研究还是比较少的,由于一般聚类方法很难处理高维稀疏数据中的异常值,所以对于高维稀疏数据聚类往往很难有高质量的聚类结果。针对这一问题文中首先提出了一种用二态属性值和最小生成树结合的动态聚类方法,该方法可根据阀值动态聚类,并能够在聚类时考虑对象属性的重要性,使聚类结果更加合理。由于自然界中的事物存在着各种关系,很多关系都是界限不明显的模糊关系,我们需要用模糊理论来描述,因此本文提出了另一种基于多元相似度和模糊相似矩阵的高
其他文献
在现代娱乐产业中,角色动画变得越来越重要。丰富的动作数据作为角色动画的基础,如何快速的获取它们已成为角色动画师的重要需求。运动捕获技术以其合成动画数据的高度真实性成
在当今的数据库应用开发中,将面向对象程序开发设计与基于关系模型的关系数据库一起使用是一件十分麻烦、费时的事。对象关系映射ORM就是用来将对象模型表示的对象和基于关系
随着个人计算机功能越来越强大以及越来越普及,闲置的计算机资源也随着增长。尤其在分布式计算更加普及后,很多典型的情景是:传统的集群在全天候的运行期间内都致力于运行需
数字林业”在国家当前的生态环境建设中和将来的知识经济社会中具有重大的作用。它将空间数据和应用领域数据有机地结合,为政府宏观决策和林业科学管理、林业资源利用、生态环
本文针对虚拟仪器的特点,研究了虚拟仪器的可设计性、扩展性与复用性并结合实例提出了设计思想与方法。结合软件体系结构研究,提出了UI-Model体系结构,明确划分了虚拟仪器的
软件体系结构开始于软件的早期设计。人们希望通过对软件体系结构进行系统、深入地研究,以提高软件生产率、保障软件的质量、改善软件维护等不断涌现的问题。质量属性是软件
随着网络的发展,人们基于网络的应用也越来越多,电子银行、电子商务等网络服务正在悄悄地进入人们的生活。与之俱来的,网络攻击也在不断地增加,或者是攻击网络系统,或者是窃取系统
本文对基于序关系的Rough集模型及知识发现进行了研究。文章讨论了基于序关系的Rough集模型及相关课题,并将该模型应用于信息系统的知识发现。本研究建立了信息系统中属性
作为互联网联盟W3C提出的下一代Web发布语言,XML是一种界定数据的简便而标准的方法,它的数据描述机制意味着它将成为一种共享信息的强大途径。其开放性、自描述性和标准性特征
目前车辆检测线中绝大多数仍采用传统的一点一线的连接方式,繁多的信号线路既不便于施工布线更不便于维护和检修,为能够改进这种信号传输方式,本文研究了一种兼容性好、通用性强