密度聚类算法及其在海洋中尺度现象中的应用研究

来源 :山东科技大学 | 被引量 : 3次 | 上传用户:bhwbx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在大数据时代,数据量的爆炸式增长让传统人工处理方法无法应对。而数据挖掘技术可以快速高效发现数据内的潜在模式和知识,其中,聚类算法作为一种常用的数据处理方式已经广泛应用于数据处理过程之中,其目标为从不含类别标签的数据中提取知识,发现数据间潜在关联并将其归类。作为一种海洋中普遍存在的现象,中尺度涡每天会产生大量的数据,无论是对中尺度涡的探测还是跟踪的研究中,较早的中尺度涡研究方法大多都是采用人工探测和追踪的方法对数据进行处理,其处理效率低下。但通过人工处理数据的再复现算法通常会出现各种缺点,而使用数据挖掘算法对海洋数据进行处理可以有效提高处理效率。因此,研究利用数据挖掘算法的中尺度涡探测和中尺度涡追踪算法,具有十分重要的理论意义和实践价值。本文重点关注密度聚类问题。详细分析现有密度聚类算法优缺点,在众多中尺度涡研究工作的基础之上,改进密度聚类算法,并将其应用于海洋中尺度数据处理。本文主要贡献如下:(1)提出了基于最小生成树的密度聚类算法。传统的密度聚类算法通常使用固定的全局参数,因此无法应对密度稀疏区域的样本处理工作。本文基于图论中的最小生成树方法,以密度为评价指标对数据集进行划分,通过对最小生成树进行剪枝处理发现簇间的潜在联系,实现对数据集内相似密度的簇做邻近化处理。(2)提出了一种基于k近邻图的密度聚类算法。现有密度聚类算法通常需要至少两个参数来保证聚类过程的顺利进行,并且参数的设定大多为非整数,参数测试过程较为复杂。通过构建k近邻图,筛选有效的相似度信息,以参数自适应的方法减少算法参数设置阶段的测试复杂度,同时保证算法的有效性。(3)提出了一种结合密度聚类的中尺度涡探测算法。在中尺度涡探测过程中,利用密度聚类对不规则簇的良好适应性,对去除非涡旋区域后的数据集进行密度聚类,筛选出潜在的中尺度涡数据集,通过加入稳定性判定条件保证结果的稳定性,进而寻找出符合要求的闭合等值线。以上方法消除了现有算法中阈值设定敏感度问题和参数设置需要进行敏感度测试的问题,同时解决了结果筛选不稳定的缺点。(4)提出了一种基于时间尺度的密度聚类的中尺度涡追踪算法。利用密度聚类可以分离样本稠密区域与稀疏区域的特点,通过添加时间尺度限制和振幅限制改变距离矩阵,将中尺度涡轨迹与环境区域进行分离,找出潜在的运动轨迹。针对出现时间冲突的路径,结合卡尔曼滤波方法剔除噪声点,提高追踪过程的准确度。通过以上方法,消除了现有算法处理过程中因串行问题导致的局部最优问题,同时提高了算法的批处理能力和运算速度。
其他文献
主要对栽培品种对墨西哥香荚兰(Vanillafragrans(Salisb.)Ames(V.planifoliaAndr.))根生长发育的基本生物学特性作了初步研究,讨论提出了一些有关香荚兰产业化种植的建议.
目的:观察反复呼吸道感染患儿进行针灸治疗后的临床疗效,拟证实针灸治疗儿童反复呼吸道感染的可行性和有效性,提高中医疗法治疗反复呼吸道感染的效率,为临床治疗儿童反复呼吸
随着教育改革的不断深化,越来越多问题穷出不尽,本文从五个方面详细的论述了农村中小学教师在工作中所面临的问题,客观的阐述了这些问题产生的原因。 With the continuous d
宇宙线是来自太阳系外的高能带电粒子辐射。自1912年发现以来,虽然研究了上百年,但是其起源尚不完全清楚。宇宙线在传播过程中会与周围介质碰撞产生高能光子与高能中微子辐射
微乳液具有诸多优良性能,可应用于含油污泥的处理。Gemini型表面活性剂因其双链的特殊结构所配制成的微乳液表现出更高的表面活性。本文主要以Gemini型表面活性剂为对象,探究
2017年,黔南州从申办第四届中国绿化博览会的诸多候选城市中脱颖而出,让这个5年一届的盛会第一次落户在西部地区、民族地区、高原山地和非省会城市。第四届中国绿化博览会承
底层文学继承并发扬了现实主义精神,形成了底层文学特有的现实美学。这里概括并分析了现实美学的特征:真实性、人民性、批判性、启蒙性。
从技术革新引发的三个阶段的变化来阐述现代信息技术的发展给信息服务工作和社会发展带来的变化。
紊流中充满了不同类型和尺度的相干结构,控制着紊动的生成、传输和耗散等过程。紊动水流携带河床底部泥沙沿流向输移形成推移质运动,同时紊流中的相干结构与推移质运动具有密
针对现有目标检测方法仅适用于大尺寸、少量特定种类交通标志的检测,且对复杂交通场景图像检测效果不佳的问题,以抗退化性能较强的ResNet101为基础网络,增加若干卷积层构建残