正则化排序算法的误差分析

来源 :湖北大学 | 被引量 : 0次 | 上传用户:rg595091068
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在很多学习问题中,有时我们不是简单的把样本分为给定的类数,而是把这些样本按一定的特征进行排序,例如,在信息检索中。在今天的信息社会,我们个人不可能掌握全部的信息,所以要根据每个的需要进行筛选,把最相关的信息列举出来,以最少的时间了解最多的信息,排序算法具有重要的应用价值,引起人们的广泛的重视,在统计学和学习理论中都得到重要的结果。   推广性的界是学习理论研究的中心问题之一,在本文中,我们根据霍夫丁分解得到了一个简单的关于U-统计的尾概率不等式,它类似于伯恩斯坦布不等式。在此基础上,与函数集是凸的和紧的假设条件下,利用覆盖数,得到一致收敛和相对一致收敛概率不等式。对样本误差,得出一个快速收敛的界。为了防止过拟合问题,在正则化框架下,还有再生核希尔伯特空间的特性,得到一个关于正则化算法的推广性的界,正则化参数的选择与收敛速率有关。   第1章介绍排序问题的早期发展的历史和一些经典的算法。   第2章给出了已知的推广性的界,它基于三个不同的标准,分别是ROC曲线,U-过程,稳定性。   第3章由经典的Bernstein不等式,经过Hoeffding分解,得到一个新的概率不等式,和分类与回归的做法一样。关于U-统计得出一致收敛和相对一致收敛的尾不等式,以上面的不等式为基础,基于最小平方损失和再生核希尔伯特空间的提出排序正则化算法,经过参数选择后,得到正则化算法的推广性的界。利用迭代方法,提高了收敛速率。   第4章与一些结果的对比和本文工作的总结和展望。
其他文献
经过二十多年的发展,线性薛定谔方程支配系统的最优控制问题取得了很大的发展。本文的目的是介绍这方面的成果。本文共分为六节:第一节介绍薛定谔方程的物理意义;第二节介绍带
学位
模糊蕴涵作为一种重要的逻辑算子被广泛应用于诸多领域,如模糊推理,模糊控制,模糊图像处理,词计算,模糊数学形态学,数据挖掘等.正是由于它的理论意义与应用价值,近年来关于模糊蕴涵
本文对求解非线性凸集约束最优化问题的Goldstein-Levitin-Polyak(GLP)梯度投影算法给出了两种改进,主要内容如下:   (1)基于修正拟牛顿方程,结合Goldstein-Levitin-Polyak(G
在一阶Heisenberg群()1意义下,本文解决了下面四个问题:   (1)根据某些曲面上的H-局部极小和H-整体极小之间的密切关系,我们证明H-极小曲面是否就是静止曲面与曲面上是否存在特征
全文共分为三个章节,分别有所侧重地进行了某一方面的研究。   第一章主要叙述Orlicz-Lorentz空间的基本理论,特别是Orlicz-Lorentz序列空间上的一些重要的基础定理。