具有新特性的自适应聚类弹性网络算法研究

来源 :北京建筑大学 | 被引量 : 0次 | 上传用户:w02114119
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据信息时代的到来,对海量数据处理的技术要求越来越高。为了更加高效地在海量数据中发现有用的隐含信息,对作为数据处理工具的聚类分析技术的要求也越来越高,相应地,聚类分析算法作为聚类分析技术中的核心内容,也面临着越来越高的要求。目前,已有学者提出了诸多聚类算法,常规算法依据聚类思想和规则的差异或者改进,可以划分为五大类:划分聚类、层次聚类、基于密度、网格和模型的聚类算法等五种不同的聚类算法。除此此外,还有一些新型的聚类算法被提出,包括基于粒度的核聚类算法、谱聚类算法等。但是,这些聚类算法都是根据数据集的不同类型和不同需求而进行设计实现,普遍具有针对性,但同时也存在着广泛应用的局限性和单一性,即不能有效适用于现有的多元、大型数据集的聚类场景。为了能够满足多元、高维大数据集的聚类分析的需求,本文提出了具有新特性的自适应聚类弹性网络算法NAENC。围绕弹性网络求解不同类型数据集的聚类分析问题进行研究,本文主要研究内容包括:(1)设计新的数据点与弹性节点之间的数学模型关系;(2)设计具有自适应学习能力的动态参数控制策略;(3)调整弹性网络模型结构;(4)设计算法优化策略等。同时,为了验证本文提出的NAENC算法性能和优势,本文对未知聚类结果的人工随机数据集进行了测试,并与经典划分聚类算法做了聚类结果的对比分析;为验证NAENC算法的真实可靠性,本文对已知聚类结果的来自UCI(http://archive.ics.uci.edu/ml/index.php)数据库的不同大小和维度的数据集进行了测试,且与经典划分聚类算法DBSCAN做了对比分析。通过上述实验测试,对测试结果比较发现,NAENC算法的SED值降低了20%左右(本文中SED值越低说明聚类质量越高)。通过对比分析,算法聚类结果稳定,网络加快了收敛速度,大大提升了聚类质量和聚类效率,节省了时间开销和空间开销。总体而言,本文提出的NAENC算法能够克服传统聚类算法在求解大型、高维数据集等方面存在的缺点和不足,能够有效规避诸如求解质量不高、时间开销大、空间开销大、求解质量不稳定、网络收敛速度慢等算法缺陷。同时,本算法能够很好的应用在多元大数据集的聚类问题中。
其他文献
石墨烯及MXene等二维材料由于具有高导电性、高比表面积等优点被认为是超级电容器的理想电极材料,本文以石墨烯和MXene作为基体制备了氮磷共掺杂碳微球/石墨烯、氢醌复合石墨
随着微纳机电系统中的器件集成度日益增高,器件表面力所带来的能量损耗也逐渐增高,比如机械硬盘中的磁头由于移动过程中和磁盘之间的摩擦而导致误码率的增高和使用寿命的降低
森林资源给人类的生产生活提供了丰富的物质资源和旅游资源,同时在调节生态平衡、净化人类生存环境方面起着重要的作用,具有很高的经济价值和生态价值。随着地理格网技术的迅
全氟辛酸(perfluorooctanoic acid,PFOA)是一种广泛存在于土壤、水域以及生物体内的有机环境污染物,在环境中具有持久性和生物积累性的特点,且会对生物产生毒性。半滑舌鳎(Cynog
改革开放以来,中国的资本市场虽然在不断地繁荣发展,但上市企业各种财务造假、欺诈丑闻却层出不穷,每一次上市企业爆发的丑闻无不令投资者遭受重大损失,而会计师事务所作为对
本研究通过SV标记并结合菌丝尖端分离纯化对草菇担孢子的非整倍性进行了相关探究,结果如下:1.本实验室对草菇单孢分离菌株PYd15和PYd21的基因组完成测序并开发出102个SV标记,
细胞分裂素(cytokinin,CK)是调控植株正常生长发育的重要激素,在延缓叶片衰老和调控作物产量等方面具有积极作用。细胞分裂素氧化酶(cytokinin oxidases/dehydrogenase,CKX)是植
目的:1.评估慢性氯胺酮给药大鼠受电针治疗前后的学习记忆能力是否有改善。2.观察并比较慢性氯胺酮给药大鼠受电针治疗前后海马及顶叶皮质结构神经元结构是否有改变。3.观察
磷是作物生长必需的大量营养元素,其缺乏会限制作物优质高产。已有的研究表明低磷或缺磷可以诱导水稻根表形成铁膜,以适应磷贫营养环境,但其形成的信号调控机制并不清楚。逆
基于结构的多样性和来源的广泛性,热解碳被认为是替代锂离子电池现有负极的理想材料之一。因此,为了提高其储锂能力,人们已采用各种前驱体和制备技术对热解碳在不同温度和压