论文部分内容阅读
在很多学习问题中,有时我们不是简单的把样本分为给定的类数,而是把这些样本按一定的特征进行排序,例如,在信息检索中。在今天的信息社会,我们个人不可能掌握全部的信息,所以要根据每个的需要进行筛选,把最相关的信息列举出来,以最少的时间了解最多的信息,排序算法具有重要的应用价值,引起人们的广泛的重视,在统计学和学习理论中都得到重要的结果。
推广性的界是学习理论研究的中心问题之一,在本文中,我们根据霍夫丁分解得到了一个简单的关于U-统计的尾概率不等式,它类似于伯恩斯坦布不等式。在此基础上,与函数集是凸的和紧的假设条件下,利用覆盖数,得到一致收敛和相对一致收敛概率不等式。对样本误差,得出一个快速收敛的界。为了防止过拟合问题,在正则化框架下,还有再生核希尔伯特空间的特性,得到一个关于正则化算法的推广性的界,正则化参数的选择与收敛速率有关。
第1章介绍排序问题的早期发展的历史和一些经典的算法。
第2章给出了已知的推广性的界,它基于三个不同的标准,分别是ROC曲线,U-过程,稳定性。
第3章由经典的Bernstein不等式,经过Hoeffding分解,得到一个新的概率不等式,和分类与回归的做法一样。关于U-统计得出一致收敛和相对一致收敛的尾不等式,以上面的不等式为基础,基于最小平方损失和再生核希尔伯特空间的提出排序正则化算法,经过参数选择后,得到正则化算法的推广性的界。利用迭代方法,提高了收敛速率。
第4章与一些结果的对比和本文工作的总结和展望。