基于图拉普拉斯的半监督学习

来源 :湖北大学 | 被引量 : 0次 | 上传用户:ladiylove
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的监督学习中,学习器只对标记样本进行训练。然而标记样本的获取常常是困难的、昂贵的、费时的。同时获取大量未标记样本相对较为容易,但是有效使用未标记样本的方法并不多。半监督学习用来解决这个问题:给定一个来自某未知分布的少量有标记示例集以及大量的未标记示例集,期望学得一个更好的函数可以准确地预测示例的标记。由于半监督学习需要很少的人工标记样本,并且能够给出更高的精度,它在理论上和实践上引起了极大的兴趣。 本文介绍了半监督学习的相关背景知识;给出了半监督学习在一些特定的模型假设下的推广误差界;介绍了流形上的半监督学习方法和基于图的半监督学习方法,并给出了相关的正则化算法;提出了一种解决核参数选择困难的核(图)组合方法;将半监督学习与图论相关知识联系起来,考虑到推广误差可以分为样本误差和正则误差,着重讨论了基于图拉普拉斯组合的半监督学习算法的推广性能,并证明了在组合图拉普拉斯空间中基于图的半监督正则化算法的推广误差与数据图本身的结构变量紧密相关。主要内容如下: 第1章介绍半监督学习的背景、意义和主要研究方法。 第2章给出了半监督学习的一些理论结果。介绍了拉普拉斯特征映射(Laplacian Eigenmaps)学习算法、流形上的半监督学习和图上的半监督学习,给出了相关的正则化算法;对于基于图的半监督学习,介绍了转导学习界并且通过最优化这个界得到了最优核表示;对于半监督分类,在聚类假设的前提下,给出了推广误差界。 第3章主要讨论基于图拉普拉斯组合的半监督学习算法的推广能力。考虑基本图的正线性组合,通过最优化线性组合中权值系数,可以得到一个最优图组合方式。在组合图核空间中,探讨半监督学习方法的推广误差界。由于推广误差可以分为样本误差和正则误差,文中利用Rademacher复杂度来研究样本误差,引入图分割(graph cut)来研究正则化误差,证明了在组合图Laplacian空间中基于图的半监督正则化算法的推广误差与数据图本身的结构变量紧密相关。 第4章是对本文工作的总结和展望。
其他文献
本文研究的论题属于W型阶化李代数的不可约表示范畴。Cartan型李代数的结构缺少像典型李代数那样作为代数群引起的李代数的结构上的对称性,至今尚未有令人满意的表示理论。对
本文主要研究Banach空间值弱鞅空间及其原子分解定理和弱原子分解定理,主要包括以下几个方面的内容: Banach空间值弱鞅空间的原子分解;Banach空间值弱鞅空间的弱原子分解;Banach
本学位论文致力于研究特殊的拟富足半群和可消半环上的格林关系.全文共分三章: 第一章给出了具有中间幂等元的拟富足半群的结构.在文章[6]中,Blyth和McFadden得到了一类具有正
现如今,无线传感器网络已经被应用于很多特殊场景,如军事、工业、环境检测、医疗健康等。它由大量传感器节点自组织形成,而这些节点自身资源的限制和应用场景的不稳定性等因
摘 要: 贯彻实施可持续发展战略,我国各经济部门时间紧迫,任务艰巨,需要找到自己的着力点,选准对行业发展影响大,能带动全局的抓手。我国建筑能耗占社会能耗的比重大增长快,推行绿色施工成为建筑业的着力点。  关键词:绿色建筑 建筑业可持续发展  中图分类号:TU文献标识码: A 文章编号:  在我国各经济部门实施可持续发展战略,应抓准能够影响行业发展的着力点。我国建筑能耗占社会能耗的比重大增长快,推行
期刊
本文用有限维逼近无限维的方法来讨论函数空间中的总体最优化问题.1991年郑权用变测度方法求无限维空间中总极值的有限维逼近,我们基于邬冬华提出的水平值估计方法给出了无限
网络故障诊断是网络管理的一个重要部分,对于网络服务质量的保证至关重要。对近几年常见的网络故障诊断方法进行了总结。将这些方法分为探测技术和数据处理方法两个大类并对
学位
凸体几何是现代几何学的一个重要的分支,Lp空间中的凸体极值理论是凸体几何研究中的一个重要课题.迷向凸体作为几何断层学的重要研究对象之一,有着广泛的应用,如体视学、仿晶学