基于聚类方法的多值函数识别算法研究

来源 :黑龙江大学 | 被引量 : 0次 | 上传用户:ssz1000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
21世纪是一个信息爆炸的世纪,随着互联网技术的发展世界的沟通变得越来越便捷。目前,已经在基础科学研究、生物信息学、移动互联网应用、电子商务等诸多领域得到极大的应用。在大数据处理与分析过程中,我们会经常发现相同来源的数据在同一坐标系中会表现出多条不同的函数图像,这样会使在数据的预测分析中同一个变量会对应多个值,我们这里称它为多值函数。如何才能识别大数据集中含有函数相关性,如何将这些多值函数信息从大数据集中提取出来,又如何将提取出的多值函数进行较好的函数拟合,这些都是当下有待于解决的问题。本文主要研究基于聚类方法的多值函数的识别和提取,针对这三点提出新的解决方法。本文的主要研究成果有:(1)提出大数据集内存在的多值函数的概念。在数学的概念上,多值函数是指一种二元映射关系,其中每一个输入变量都至少对应一个输出结果,而且有些还会对应不止一个输出结果。在大数据处理与分析过程中,会经常发现相同来源的数据在同一坐标系中会表现出多条不同的函数图像,或者在某一节点之前是同一支函数在该节点之后出现多分支函数,这样会存在数据的预测分析中同一个变量会对应多个值的现象,我们这里称它为大数据集内的多值函数。(2)提出了基于随机窗口在数据上的两种MIC计算方法。第一种算法W_MIC算法采用了由局部数据的最大MIC值的结果来决定数据是否具备函数关系挖掘的价值,如果数据的局部存在较强的相关性我们认为数据是值的挖掘的。第二种算法A_MIC算法采用多个随机窗口取均值的方法估算全局数据的MIC,其结果与计算全局数据的MIC值有相近的计算结果。以上两种算法针对不同的目的使用,都会大大节省了计算时间的开销。(3)提出了一种基于谱聚类的多值函数识别的MKSR算法。利用谱聚类在图切割上的优点,结合K-means方法和高斯-牛顿迭代算法提出了MKSR算法。首先利用MIC值对数据进行可计算预判,然后利用K-means方法对大数据集进行初始的聚类,得出各个簇的数据中心点,再用数据中心点进行谱聚类划分标记,最后分别对不同的标记用高斯-牛顿迭代算法求出相应的非线性回归的函数关系,从而实现对多值函数各关系的识别和输出。
其他文献
受自然界中超疏水现象得到启发,超疏水表面的研究引起了众多学者和专家的兴趣,其制备技术和方法也在不断的更新和发展。从“荷叶效应”可知,微纳米粗糙度结构和低表面能化学
伴随着互联网电商行业的发展,越来越多的消费者流向线上,线下客流有限,零售行业竞争越发激烈。同时,多数实体商家在店铺运营中处于被动,门店依赖自然流量获客,缺少主动营销手段,常客户未能持续发掘其消费潜力,缺少客户关系维护工作,导致了经营效益大打折扣。为了摆脱客源困境,越来越多的实体商家意识到了会员营销的重要性,希望借助会员管理系统的信息化管理能力,来高效、精准的完善门店会员营销,最终在行业市场上稳稳地
曲轴主轴承是内燃机最为关键的摩擦副之一,其润滑性能直接关系到内燃机工作的可靠性和耐久性。大功率船用柴油机高可靠性、高功率、低油耗的技术需求使得最高燃烧压力、平均
在能源日益枯竭的今天,热电材料在可再生能源方面被寄予厚望。地球上有无处不在的热源:从太阳能到工业或车辆废气,都可以使用热电材料转换成电力。聚苯胺(PANI)是最常见的导电聚合物之一,由于其易合成、高稳定性、可控的导电性和有趣的氧化还原性质而引起了相当大的关注。但聚苯胺在有机溶剂中的溶解度较低,且加工性差,制约了聚苯胺的实际应用。苯胺寡聚体在保留聚苯胺优异性能的同时,因其所独有的纳米结构增大了比表面
西方儿童幻想小说自19世纪以来已逐渐取得巨大的成就。受到外国儿童幻想小说的影响,中国儿童文学作家在20世纪末才开始有明确的儿童幻想小说这一文体创作意识,但由于起步较晚
长期以来,由于我国的法律制度对非婚同居关系一直持“不干预、不保护、不惩罚”的态度,使得非婚同居一直面临比较尴尬的局面。老年人作为一类特殊的群体,在这种局面下可能面对的情况更复杂,由此引发的一系列现实问题逐渐引起社会广泛关注。本文旨在通过对老年人非婚同居的民法问题进行研究,得出相关立法建议,以期更好地保护老年人合法权益。本文主要采用了文献研究和案例分析的方法。首先,对老年人的最低年龄标准和非婚同居的
目的:本课题通过回顾分析2018年川北医学院附属医院儿科所收治的社区获得性肺炎患儿基本特征、临床表现、辅助检查、干预手段、预后及转归等信息,初步了解本院及本地区CAP患儿的诊治水平,为今后进一步提高本院及本地区儿童社区获得性肺炎(community acquired pneumonia,CAP)的临床管理水平提供数据信息和参考意见。方法:本课题选取2018年1月1日至2018年12月31日于川北医
自然环境的恶化一直是一个长久性的问题,在多种环境问题中,水资源污染问题首当其冲,重金属污染一直被人们所重视,尤其是饮用水中重金属离子超标问题。由于它们的过度积累、生物放大和毒性,水中重金属的超标已经引起了政府和公众的密切关注。重金属主要以自然和人为为来源,对土壤、水环境以及植物产生巨大的危害。水中的重金属污染对人类及其他生物健康造成长远和持久的损害,因而,寻找一种快捷、准确、稳固、高效的水中重金属
本研究重点探讨了成人依恋对异性恋大学生亲密关系满意度的影响以及感知冲突在其中的中介机制。包括两个部分:首先采用动态评估与问卷法相结合的方式对大学生在日常亲密关系
机器视觉在现代制造业有着广泛应用,制造过程中的运动目标检测与跟踪己成为现代制造领域的研究热点。目前,在生产中应用的工业机器人,一般采用示教或者离线编程的方式工作,只