【摘 要】
:
随着数据采集技术的不断发展,具有海量表现形式的复杂多视图数据不断涌现在科学探索和日常生活的各个领域中。所以,研究多视图数据分析问题具有重要的实际价值和意义。多视图分类是多视图数据分析的基础,现有的多视图分类方法大多为基于线性判别分析的,它们要求输入数据服从全局高斯分布,并且无法捕获数据的潜在局部结构,导致适用性差。而一些局部感知方法虽然能够捕获数据的局部结构,但是它们涉及KNN过程,需要预设邻域数
论文部分内容阅读
随着数据采集技术的不断发展,具有海量表现形式的复杂多视图数据不断涌现在科学探索和日常生活的各个领域中。所以,研究多视图数据分析问题具有重要的实际价值和意义。多视图分类是多视图数据分析的基础,现有的多视图分类方法大多为基于线性判别分析的,它们要求输入数据服从全局高斯分布,并且无法捕获数据的潜在局部结构,导致适用性差。而一些局部感知方法虽然能够捕获数据的局部结构,但是它们涉及KNN过程,需要预设邻域数或局部特征矩阵,灵活性低。与此同时,现有的大多数深层多视图分类方法没有充分考虑多视图数据的固有结构特性,无法有效地提取视图不变表征。针对上述这些问题,本文研究多视图局部自适应判别分析(MvLADA),基于深度对抗网络的多视图数据分类方法(MvDAN)和基于深度对抗网络的增强多视图数据分类方法(MvDANE)。论文的主要研究内容如下:1、已有的大多数基于线性判别分析的多视图分类方法依赖于输入数据服从全局高斯分布的假设,但现实生活中的数据通常是非线性的,导致算法适用性差。此外,一些局部感知多视图分类方法涉及KNN过程,需要预设邻域数或局部特征矩阵,算-法灵活性差。针对上述问题,本文提出了多视图局部自适应判别分析(MvLADA)方法。MvLADA将线性变换学习和加权矩阵学习集成到一个统一的框架中,自适应地学习由所有视图共享的加权矩阵。MvLADA对输入数据的分布没有要求,而且它通过自适应学习得到的加权矩阵来捕获数据的内在局部结构,适用性强。此外,MvLADA在不执行KNN过程的情况下,自适应地学习加权矩阵,更可靠地捕获数据的潜在局部结构.,灵活性强。它是一种无参数的方法。本文在多视图数据库上进行了实验,证明了本文算法的有效性。2、MvLADA是一种浅层多视图分类方法,不能提取出多视图数据的深层特征,而现有的大多数深层多视图分类方法无法有效地提取视图不变表征。针对这些不足,本文提出了一种基于深度对抗网络的多视图数据分类方法(MvDAN),它利用特征投影机和视图分类器之间的相互博弈,可以更有效地得到视图不变表征。特征投影机捕获多视图数据的潜在共享属性,其通过结构保存迫使不同视图间同类的样本距离近,不同类的样本距离远。视图分类器捕获每个视图的特定属性,并尝试根据不同视图之间的差异区分样本的视图。此外,MvDAN还引入标签预测结构通过最小化交叉熵损失得到样本的预测标签。但MvDAN没有对提取出的同一视图内的深层特征进行距离度量,因此不能确保学习到了理想的分类边界。针对这个问题,本文进一步提出了基于深度对抗网络的增强多视图数据分类方法(MvDANE),它在MvDAN的基础上引入视图内度量损失,使得同一视图内同类的深层特征距离近,同时不同类的深层特征距离远,以充分提取多视图数据的判别信息。本文在几个常用的多视图数据库上进行了实验,证明了本文算法的有效性。
其他文献
伴随着多媒体技术的快速发展,数字产品的应用越来越广泛。然而开放环境中数字产品的版权保护与信息完整性保护成为亟待解决的重要问题。数字水印技术作为实现多媒体版权保护
近年来,随着信息技术的不断革新,大数据领域发展迅猛,大数据蕴含的经济价值、社会价值开始凸显。时代的发展对政务公开制度提出了新的要求,从政府信息公开走向政务数据开放已是大势所趋,世界各国都在积极地推行政务数据开放。事实上,政务数据开放的出现并没有取代政府信息公开,而是与政府信息公开一起完善和丰富了开放政府的结构与内容,构成二元并立的开放机制体系。政府机构作为最大规模的原始信息采集者,掌握着最为丰富的
本报告翻译材料节选自托尼·莫里森的《他者的起源》前两章。《他者的起源》是托尼·莫里森2016年在哈佛大学讲座的内容合辑,呈现了作者所关注的美国黑人文化及种族问题。通
近年来,Bresse系统问题及其理论被广泛应用于工程、物理以及材料科学等领域.因此,对于此类问题的研究受到了许多自然科学工作者的高度重视.本文主要讨论具有记忆项的热弹Ⅲ型Bresse系统解的长时间动力学行为,运用Chueshov和Lasiecka发展出来的方法得到了拟稳定的性质、全局吸引子的存在性、吸引子关于时间的正则性和广义指数吸引子的存在性.全文分为四部分:第一章:介绍了Bresse系统问题的
写作能力是语言技能的重要组成部分,是英语学习者对英语知识的综合运用,学习者的英语水平如何很大程度就反映在写作能力上。掌握英文写作能力要求高中生不仅具备拼写,标点,语
太阳是一颗非常活跃的恒星,每时每刻都在向地球输送能量,对太阳射电爆发的研究不仅可以揭示空间天气的规律,最大程度减少灾害性空间天气造成的影响,同时也与我们的日常生产生活密切相关。太阳射电爆发是一种射电波段观测到的剧烈流量增强现象。对太阳射电爆发的观测和记录目前仍普遍采用人工检测方法,这种方法既费时又费力,还有随意性、遗漏性等诸多弊端。随着数字图像处理技术的发展,将其应用到射电天文学领域实现频谱图像的
21世纪以来,云从业者越来越多,云生态越来越完善,越来越多的企业拥抱云平台。这对支撑着云计算发展的关键--虚拟化技术提出了更多地挑战。I/O虚拟化作为虚拟化技术的重要组成
随着汽车工业的发展、5G网络的普及,车联网迎来飞速的发展,车联网中存在的数据隐私、数据可信性等问题也随之暴露出来。车辆一旦联网,利用车辆发送的数据信息很容易可以追踪到用户的隐私数据,如姓名、位置、行踪等。这些数据一旦泄露,将对车主造成很大的伤害。然而,用户一旦隐私受到保护或者匿名,在不暴露身份的情况下可能会发布虚假消息。区块链技术近年来有了迅速的发展,并且已经在多个领域得到了应用。为了解决目前车联
CDCL(Conflict Derive Clause Learning)算法是解决布尔可满足性问题(Satisfiability Problem,SAT)的一种完备算法,CDCL算法求解过程的基本阶段依次为:预处理;分支决策;布尔约束传播(Boolean Constraint Propagate,BCP);非时序性回溯;随机重启。分支决策是CDCL算法中重要的阶段之一,CDCL算法中的分支策略是
本文以对新媒体有敏锐触觉的200个新闻传播知名学者新浪微博为样本,采用内容分析法,从三个角度探讨常态下微博粉丝数的影响因素:人口统计学特征(共计12个变量)、表层内容(共