基于高维数据聚类分析方法的有效性研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:mooreman009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在机器学习中的聚类技术被人们看作是非常有研究价值的内容,在金融中的诈骗、医疗中的诊断、图像中的研究、信息中的搜索以及生物中的信息学等很多方面都受到了关注和研究。现如今,针对聚类技术的有关的算法被给出和实践应用。随着科技的进步,数据也随之越来越多,同时也呈现出了复杂的结构特性,比如多维性、不均匀性、冗余性等等多种结构。由于数据的形式影响着聚类的效果,故随着数据的不同特性的出现,随之也就出现了很多的聚类算法,但是没有万能的聚类算法。所以针对当今数据的特性寻求有效的聚类算法是一个必要的研究的内容。本文研究的是多类型结构的数据,探求出有效的聚类算法。本文的主要研究主要内容是:1、针对分类型数据的特点提出了一种新的属性加权聚类算法,并将其应用于聚类过程中形成新的聚类优化问题。2、提出一种面向高维数据的属性双加权优化聚类算法,通过标准化的形式得出算法中的矩阵的划分、类的中心集以及属性的权值在实现的过程中的规则,进而实现了最优解的获得。证明了该算法的收敛性。3、通过利用UCI中的高维分类型数据进行仿真,验证算法的有效性和时间复杂度。实验体现出文本提出的算法不仅继承Chan等人提出算法的简便性,同时又解决了针对分类型数据加权失效的问题。本文的研究可以改善算法对分类型数据失效的难题,为生物中产生的数据、来自Web端的数据、客户交易中产生的数据等多方面给予了技术方面的支持。
其他文献
加强党员干部道德建设一贯是全党、全社会关注的课题,不仅具有重大的现实意义,而且具有深远的历史意义。本文简述了党员干部加强道德建设的重要性,论述了加强道德建设作为党员干
时间序列是按时间的先后顺序排列而成的数列,广泛存在于社会生产的各个领域,形成规模庞大的时间序列数据库,真实地记录了应用系统在各个时刻的重要信息。时间序列分析已成为机器
近年来,基于生物免疫系统原理发展而来的人工免疫系统己成为计算智能的新方向,并大量应用于优化控制、模式识别及计算机安全等领域。在入侵检测技术中,尤其在拒绝服务攻击的检测
随着非线性科学研究的发展,非线性发展方程的求解成为研究非线性问题的一个重要内容。许多数学家和物理学家为此做了大量工作。为了更准确、客观的描述物质的复杂的运动变化
学位
矩阵符号模式在经济学、化学、计算机科学等领域都有广泛的应用,同时符号矩阵也是组合矩阵论中一个活跃的研究方向。矩阵符号模式的研究起源于1947年美国经济学家P.A.Samuelso
历史的时钟在又一个7月1日敲响,中国共产党走过了83年的光辉历程。值此党的生日之际,我们向辛勤工作在各条战线上的广大共产党员致以亲切的问候和节日的祝贺!我们党从成立那
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
现阶段,需要将中华民族的传统体育作为一项教学项目引入到学校中,从而确定了传统民族体育在民族中学体育课程中的地位以及价值意义,根据民族中学的教学情况,将适合教学的少数
分数阶微分方程是非整数阶常微分方程的泛化。这种泛化不仅仅是数学上的变化而且在科学与工程的很多领域,例如粘弹性学、电路学和单神经元模拟等有很多应用。分数阶微分方程在
本文围绕Mei对称性这一主题,主要研究准坐标下一般完整系统Nielsen方程的Mei对称性导致的Mei守恒量,变质量Chetaev型非完整非保守系统的Nielsen方程的Mei对称性和Mei守恒量,
学位