支持向量机算法PAC-Bayes边界理论与实验研究

来源 :天津大学 | 被引量 : 1次 | 上传用户:weiyideta21
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
PAC-Bayes边界理论融合了贝叶斯定理和随机分类器的结构风险最小化原理,为机器学习算法提供了一个理论框架,进而可以推导出最紧的泛化风险边界。该理论的有效性和正确性可由概率近似正确性理论和贝叶斯决策理论推导得到。PAC-Bayes边界是衡量机器学习算法泛化性能的重要统计量,具有严格的数学形式和一般意义。本文根据PAC-Bayes边界理论,将其运用于评价支持向量机(SVM)的泛化性能。首先,使用五个UCI数据集分别进行封闭测试和开放测试,测试得出PAC-Bayes边界和敏感性、特异性和正确率统计指标。分析PAC-Bayes边界值和对应的统计指标的协方差与相关系数,实验结果表明PAC-Bayes边界值与分类正确率具有很高的负相关性,与敏感性和特异性也具有一定的负相关性。其次,PAC-Bayes边界方法作为模型性能评价的方法,将它与N折交叉验证方法进行比较。它们的实验结果是一致的,说明PAC-Bayes边界能够较好地反映泛化风险边界。再次,将PAC-Bayes边界通过模型选择应用于SVM,实现快速优选SVM的惩罚系数和核函数参数。最后,将SVM和PAC-Bayes边界应用于蛋白质结构预测中。PAC-Bayes边界在实际应用中的主要问题是,在概念空间下估计不确定的先验分布和后验分布。本文通过使用核方法,以再生核希尔伯特空间来构造概念空间,并提出以随机采样方法和马尔科夫链蒙特卡洛采样方法来模拟概念空间的后验分布的采样,进而计算KL相对熵及PAC-Bayes边界。同时通过方差最小化方法来评价支持向量的统计显著性,以实现支持向量及其权向量的优化。在两个人工设置的数据集上进行实验,实验结果表明,该模拟方法在实际应用中是合理且有效的。在以再生核希尔伯特空间来构造概念空间的基础上,本文还提出一种融合模型反馈信息的改进马尔科夫链蒙特卡洛采样方法,来模拟对概念空间后验分布的采样。同时使用核密度估计方法对后验分布进行概率密度估计,求得后验分布与先验分布的KL相对熵,进而解决PAC-Bayes边界的计算问题。最后分别采用随机采样方法、马尔科夫链蒙特卡洛方法和改进的马尔科夫链蒙特卡洛方法进行实验,实验结果表明,该方法使得PAC-Bayes边界的计算问题得到了改进。
其他文献
随着空间技术的发展,空间机器人系统中的柔性部件(主要为柔性关节和柔性臂)对系统的影响已不容忽视。同时,实际控制过程中多重复杂工况(遥操作空间机器人的时延问题、空间机
通过对施放气球中安全隐患问题的探讨,提出了有效的防范措施。对开展此项工作的同志有很好的借鉴意义。
中小企业的资金短缺问题,作为一个至今尚无良好解决方式的全球性问题,不管国家的发达程度如何,都始终存在。究其根本,可抵押物品价值不足,以及信用记录的不全面,无法满足金融
金融资源配置是一个涉及配置主体、配置客体、配置方式和配置途径的行为金融系统。在中国农村金融资源配置过程中,不同配置主体完成的配置职能存在着一定的差别。实际上,中国
会计信息失真和会计职业道德滑坡使社会对会计行业失去了应有的信任。找寻会计职业道德滑坡的原因,探索重振会计职业道德的途径,在会计行业建立起以诚信为基础的会计职业道德
根据对钢厂炼钢-连铸流程中各工序的功能及相互关系的分析,建立炼钢-连铸流程简化模型,从理论上分析转炉和连铸机主要参数应满足的衔接匹配要求。在中冶连铸公司炼钢厂实际数
为了解决模具曲面研磨中去除量不均的难题,提高自动研磨模具曲面的加工质量,设计了一种用于模具自由曲面自动研磨加工的实验装置,在优化加工工艺参数的基础上,提出了基于模糊控制
在经济快速发展带动下,企业的发展速度不断加快,在中央群众路线及党内廉政建设的开展下,对企业秘书工作的职业要求也日益严格,由于秘书在企业中处于十分关键的位置,所以其工作效率
20世纪50年代我国开始实行语法教学以来,遇到了很多难题,经历了曲折的发展过程,其主要原因是汉语语法系统的特殊性,以及教师严重缺乏在中学进行语法教学的经验。正当语法教学