混合聚类集成研究

被引量 : 0次 | 上传用户:sweetpingping
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
集成学习是近年来机器学习方面的研究热点。这种方法能使用特定组合方式将多个分类器或聚类模式组合起来,从而显著提高学习系统的泛化能力和准确性。而聚类集成作为集成学习中的重要组成部分,业已被广泛应用于各种领域。目前已经提出了许多的聚类集成的方法,这些方法能够有效地解决低维标准数据集的聚类集成问题。但是由于实际应用中数据的复杂性,在处理许多问题时,现有的算法经常失效。特别是对于高维数据、含噪声特征的数据以及大样本数据的情况。因为传统聚类集成方法1)对高维数据进行聚类时,许多无关的特征会对结果造成不好的影响同时也延长了处理时间;2)对于含噪声特征的数据,传统的聚类集成算法基本不能对其进行有效的聚类处理;3)对于大型数据的情况,在最后进行结果集成时,由于结果的规模太大,而导致运行时间过长。本文根据现有聚类集成算法的上述不足之处,分别提出了两种行之有效的方法:1)对特征进行聚类来降低数据维度,同时去除噪声特征;2)提出结构集成的思想来简化聚类集成的过程,从而降低运行时间。在实验部分,本文分别使用了合成数据集、网上公开的基因数据集以及UCI机器学习数据集来对上述两种方法进行测试。实验结果表明,新提出的方法能够取得令人满意的效果。
其他文献
纺织印染行业在为我国经济发展带来巨大贡献的同时,在能耗和污染物排放量方面的问题也较为突出。截止2013年,广东省印染废水年排总量9.5亿吨,由于印染污泥具有高N、S元素含量、
为了提高强非均质性煤系致密砂岩储层裂缝识别效果,根据测井资料,利用动态弹性力学模型对该类储层进行裂缝预测。首先利用寻优算法及阵列声波测井资料获取岩石各模量参数,然
加山又造(1927—2004)是日本近代杰出的画家。他与杉山宁、高山辰雄、东山魁夷、平山郁夫并称为日本画坛的“五座大山”,五人风格各异对日本画坛有着极大影响。加山又造不仅
树突状细胞(dendritic cells,DCs)是目前已知功能最强的抗原提呈细胞(antigen presenting cell,APC),是介导固有免疫和适应性免疫的桥梁,在机体抗感染、抗肿瘤等方面发挥重要
青主是我国现代音乐史重要的音乐理论家、作曲家。通过对青主音乐创作观的阐述及他的音乐作品的分析,本文认为,青主无论在音乐创作思想与创作原则上,还是在音乐创作实践中都从音
目的统计分析门诊老年患者潜在不适当用药情况,促进合理用药。方法依据2012版《老年患者潜在不适当用药Beers标准》(简称Beers标准),对某院年龄≥65岁老年患者的门诊处方进行统
在京郊挖沙废弃地上开展了柳枝稷、荻和芦竹的生物质品质氮肥效应研究,结果表明:施用氮肥对柳枝稷的纤维素、半纤维素、木质素含量影响均不显著;对荻和芦竹的纤维素、木质素含
混凝土耐久性问题十分复杂,既是实际土木工程中不可忽视的重大技术问题,又是当今国内外混凝土学术界重点关注的重大科技问题。硫酸盐、氯盐和镁盐等化学腐蚀问题,干湿循环引起的
依托G78汕昆高速公路汕揭段(汕头~揭阳)沥青路面车辙病害处治工程,进行厂拌热再生技术沥青罩面工程的应用研究。经试验段性能检测发现,即使采用针入度较低、老化程度较高的旧
目的:回顾性评价温州市中心医院门诊老年糖尿病患者潜在不适当用药(potentially inappropriate medication , PIM )情况。方法以Beers判断标准(2012版)为依据,对我院2000例≥60岁老