【摘 要】
:
半监督学习是机器学习近年来的热点研究方向,而协同训练(Co-training)则是半监督学习中的重要范式,它利用双视图训练两个分类器来互相标记样本以扩大训练集,以此借助未标记样
【机 构】
:
南京大学计算机软件新技术国家重点实验室
论文部分内容阅读
半监督学习是机器学习近年来的热点研究方向,而协同训练(Co-training)则是半监督学习中的重要范式,它利用双视图训练两个分类器来互相标记样本以扩大训练集,以此借助未标记样本提升学习性能.在实际应用中,视图通常会受到属性退化和噪声的影响而变得不充分(即视图不能提供足够的信息来正确预测样本的标记).在不充分视图下,两个视图上的最优分类器变得不再兼容,一个视图中的分类器标记的样本可能不利于另一个视图学得最优分类器.针对这一问题,提出一种改进的协同训练算法Compatible Co-training,它记录学习过程中每个未标记样本被赋予的标记,通过比较更新后的分类器对样本预测的标记与其初始标记,动态地删除标记不一致的样本,从而除去不利于学得最优分类器的样本.实验结果显示出Compatible Co-training比协同训练具有更好的泛化能力和更快的收敛速度.
其他文献
将低温地域柴油发电机组的热管理系统技术应用于数据中心内燃机发电机组领域,采用智能变速风扇和电子水泵系统,对柴油机和发电机的相关特性优化匹配,优化利用润滑油温度对柴
传统电化学传感器具备灵敏度高、测试快速、易于构建、成本低等优点,但是也存在重现性差、易受复杂环境干扰等问题。基于一对双信号转换模式的比例电化学生物传感器可以有效解决上述问题。在传感器的设计过程中引入两种或两种以上电化学活性分子,然后将输出信号换算为两个电活性物质电信号的比值。由于相同测试体系中的两种或多种电活性物质的电信号所受的干扰是相似的,所以用电信号比值作为输出信号能够部分消除来自背景及体系自
目的:每个人胸腺的大小、形态及内部密度各不相同,随着年龄的增长,胸腺组织逐渐被脂肪组织所替代。有时由于人们对正常胸腺CT表现的认识不足,导致判断错误,给患者增加了不必要的检
表面肌电信号(Surface Electromyography,sEMG)是人体肌肉收缩时,运动单元动作电位序列(Motor Unit Action Potential Train,MUAPT)在检测电极处叠加形成的混合信号。通过对sEMG信号的分析可以准确的得知人体的运动意图,同时,因其具有易于采集,无创等优点而被广泛的应用于假肢控制、人机交互等领域。当前研究者利用sEMG信号来分析人体运动意图
背景:良性前列腺增生(BPH)是中老年男性常见的泌尿系统疾病,是引起排尿障碍的常见病因之一,其临床表现有尿频、尿急、夜尿增多等膀胱刺激症状以及尿线变细、尿流中断、进行性
积极开展对农业的行业审计,是农业经济持续、稳定、协调发展的重要保证。所谓农业行业审计,从一般意义讲,就是农业各级主管部门,对各类国家投资于农业的资金,特剐是专项资金进行的
作者于2002年7月~8月和2003年6月~8月先后对内蒙古大青沟国家自然保护区的直翅目昆虫进行了系统调查,研究了大青沟保护区直翅目昆虫的群落多样性及其生态适应特性。主要内容包括
美国新移民小说作为海外华文文学的一部分,以其独特的文化姿态成为大陆当代文坛的重要组成部分。美国新移民小说的中国书写是美国新移民作家将创作指向中国历史、当下、改革
随着高校所处的社会环境和经济环境的日益变化,社会各界对于大学生的能力、素质要求也日趋多元化和复合化。在这样的背景下,提升大学生综合素质,开展各类主题实践活动显得尤
生活水平提高的同时,对环境的保护也越来越引起了人们的重视。因此,利用便携式设备实时监控周围环境已成为生产生活中必不可少的部分。气体传感器是一种监测周围环境气体浓度变化的设备,金属氧化物气体传感器以其价格低廉、便于携带、准确度高等优点得到了广泛的应用。宽禁带半导体功能材料SnO_2和TiO_2由于其化学性质稳定、气敏性能优良、来源广泛、价格低廉,现已成为气敏材料中的研究热点。本论文为了进一步提高气敏