基于数据的学习:埃尔米特算法与黎曼流形上的法向量估计

来源 :中国科学技术大学 | 被引量 : 1次 | 上传用户:yyyypolo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在本文中,我们主要研究学习理论中关于回归,流形学习和数据分析的一些算法。我们将详细地讨论这些算法的设计,并从逼近论的观点讨论其渐近性质。   论文的第一部分,在再生核Hilbert空间中最小二乘回归正则化算法的框架下,我们研究了基于梯度样本数据的学习问题。在表示定理的帮助下,算法的求解归结为求解一个线性方程组,系数矩阵中涉及核函数值的Gramian矩阵以及核函数偏导数值的Hessian矩阵。额外的关于梯度的样本值可以提高算法的学习性能。通过运用采样算子分析样本误差和Sobolev空间中的积分算子分析逼近误差,我们给出该算法的误差分析。   法向量估计是处理点云数据以及计算机图形学中曲面重构的重要研究课题。在论文的第二部分,我们考虑欧式空间中余维为1的子流形上的法向量估计问题。由于流形是未知的,我们要利用在流形上随机采样得到的样本点来估计法向量。我们提出了一种由核函数构造的学习算法,它实际上是无监督形式的梯度学习。算法的求解归结为求解一个线性代数的特征向量问题。在真实的法向量和采样分布满足一定的条件时,我们得到了关于该算法的误差估计。   在论文的最后一部分,我们主要讨论样本依赖假设空间中的正则化回归问题。对于给定的一组样本数据,样本依赖假设空间中的函数定义为由核函数和样本数据产生的一族基函数的线性组合,因此空间中的函数完全取决于其线性组合的系数。这种核函数构造的假设空间其依赖样本的特质给学习算法带来很大的灵活性和自适应性。在这种空间里讨论的正则化算法与传统的再生核Hilbert空间中的算法有本质的不同:我们所考虑的核函数不是对称的,从而不具有半正定性,正则化子作为作用在该空间中函数上的泛函,被取为其相应的组合系数的(e)p范数的p次幂。这种不同增加了误差分析的困难。   具体来说,我们主要在本文中研究了两种情况:p=1和p=2。当p=1时,(e)1正则化子经常会使解向量具有稀疏性,从而极大提高算法运行的效率。当p=2时,相应的算法是线性的并且可以通过一个线性方程组来求解。这两种算法都已经被一些文献研究过。在本文中,我们利用关于(e)2经验覆盖数的中心极限定理得到了学习算法目前为止最好的收敛阶。因为我们的目的是给出一种容量相关的分析方法,对于在误差分析中出现的由非对称核函数构造的函数空间,我们给出了其中的单位闭球关于(e)2经验覆盖数的性质,这在我们的分析中起了十分关键的作用。
其他文献
近年来,由于人类对大型食肉动物的重要性缺乏认识,导致了大型食肉动物的大量消失甚至灭绝,食物链顶端缺失会破坏生态系统的平衡.如何在短时间合理调节生态系统的平衡是人与自然
一个有序对G=(V,E)称为一个无向图,其中V和E一般是有限集.V中的元素称为图G的顶点,E是由V中不同元素的无序对组成的集合,E中的元素称为图G的边.通常用V(G)和E(G)来表示图G的顶点
本文包含三个部分。第一部分回顾了有理插值存在性研究的历史发展沿革。   第二部分研究了型值点的位置与有理插值存在性的关系:给定m+2个型值点,通过对型值点几何分布的分
粒子群优化(Particle Swarm Optimization, PSO)算法是一种较新的全局优化方法。与遗传算法、蚁群算法等大多数进化计算方法一样,PSO算法也是一类基于群体智能的随机优化算法
<正>会理县现有石榴面积1.93万hm2,产量34万t,产值13.12亿元,带动二、三产业8.5亿元,是全国八大石榴产区之首,所产石榴享誉川内外,开发出了石榴盆景、石榴酒、石榴饮料等系列
广义随机系数自回归模型是重要的非线性时间序列模型,利用该模型在拟合众多的动态的经济、社会及自然等现象时效果较好.关于该模型的性质和参数估计的相关问题一直是研究的热
样本分类是数据挖掘一项非常重要的任务,在众多分类方法和理论中,贝叶斯分类方法具有坚实的统计理论基础,其简单形式是朴素贝叶斯方法(NBC模型),由于具有简单快速的计算过程及泛