【摘 要】
:
随着信息技术的发展,数据量爆炸式增长。如何将这些数据进行分类,从而实现高效的利用,这是当前数据挖掘研究的重要内容之一。其中,基于稀疏图的高维数据分类的变分方法正成为
论文部分内容阅读
随着信息技术的发展,数据量爆炸式增长。如何将这些数据进行分类,从而实现高效的利用,这是当前数据挖掘研究的重要内容之一。其中,基于稀疏图的高维数据分类的变分方法正成为机器学习等领域的重要研究方向。这种方法主要是基于图割的思想,通过构建无向加权图的方式实现对数据的分类。本文研究是在离散非局部全变分的框架下,为系统分析不同平衡约束的性能,综合了等式约束(两种)、单向不等式约束、双向不等式约束,Ratio Cut、Normalized Cut和Cheeger Cut等七种不同的约束方法。在研究不同约束的过程中发现,Normalized Cut平衡约束能力不足,尤其是当数据集不平衡时,约束能力将进一步下降。为解决这一问题,对Normalized Cut进行改进,将度平衡度约束引入到能量泛函中,提高Normalized Cut的约束能力。在对多类高维数据进行分类时,由于传统Potts模型是通过n个标记函数实现n类数据的分类,计算效率较低。为提升计算效率,文中提出基于Potts模型矢量化加速方法,以并行计算的理念来简化算法。为简化上述模型的计算,本文采用增广拉格朗日方法求解,每步计算结果采用约束处理的投影方法,从而减少Lagrange乘子数目及惩罚参数数目。为更科学有效的验证本文所提出算法的有效性,本文分别采用国际数据分类领域的标准数据集和人工数据集进行多次实验,取其平均值,对所提出的模型和快速算法的计算精度、效率等进行了比较,验证了所提出模型与算法的有效性。
其他文献
互联网、物联网、云计算等信息技术把我们带到了多元智能的网络化大数据时代。然而,大量的资源共享和实时的交流探讨使网络空间中的数据呈爆炸式增长,其规模巨大且形式多样,
湖北在建设文化强省的过程中,电影产业的持续健康发展是题中应有之意。对湖北电影进行定量研究,经过统计分析来描述湖北电影的特征,不仅可为其他电影产业研究者提供详实的数据,也是认识湖北电影的现状、推动湖北电影未来发展的基础。引言部分陈述了本研究的背景及意义,梳理了部分国内外电影产业研究的相关文献。正文第一章首先介绍了SCP理论的发展沿革,对哈佛学派产业组织理论、芝加哥学派和新奥地利学派产业组织理论、新产
近年来国家大力践行绿色发展理念,地震勘探领域中依靠炸药产生地震波信号的方法受到严格限制,已经越来越不能适应实际工程需要。电火花震源作为一种绿色环保震源,可以代替炸
随着移动通信的不断发展,越来越复杂的网络结构使得信息安全传输更容易受到威胁。基于密钥体制的高层安全协议和加密算法等方法虽然可以在一定程度上提升信息安全性,但无法克
本文主要研究沟道宽度缩小到5nm和6nm的新型U形沟道场效应晶体管,由于在亚十纳米级尺寸下,制造结型的半导体器件十分困难,且掺杂等相关工艺很难实现,故主要致力于制造工艺相
为了提高新一代高效视频编码标准(High Efficiency Video Coding,HEVC)的传输鲁棒性,使视频经互联网或无线通信网络等不可靠信道传输后还能获得高质量的重建,本文开展了第一
图像去噪问题可以分为加性噪声去除和乘性噪声去除。之前对加性噪声的研究更为广泛,后来随着图像中乘性噪声的普及,大家开始加深对乘性噪声的研究。随着变分方法在加性噪声方
近年来,云计算作为新兴产业,得到了迅速发展。外包计算作为云计算的一种重要形式,也得到了人们的广泛关注。在外包计算中,资源受限的终端能够将本地计算昂贵的任务交付给云来
近几年互联网信息技术的飞速发展给个人、企业、政府部门以及社会的方方面面带来的极大的便利,大量的电子数据随之产生,数据在各个领域的作用也变得更加显著。XML类型数据作
近几年来,随着大数据的发展,数据的获取途径变广,对数据处理的要求愈加严格。在计算机视觉领域,随着高维数据的爆炸性增长,现存的聚类算法受制于空间的复杂性已无法满足对精