基于快速搜索自然邻居的自训练算法

来源 :重庆大学 | 被引量 : 0次 | 上传用户:fishwatcher
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在现实生活中存在大量廉价易获得的无标记样本,具有指导性作用的有标记样本获取十分昂贵且耗时,为了充分利用有标记样本和无标记样本的信息,半监督学习算法在这种情况下就诞生了,获得了众多学者的高度关注。自训练算法是半监督学习中常用的一种方法,其采用数目较少的带有标记的样本点学习,通过寻找少量有标记样本的高置信度点训练得到高性能分类器。自训练算法中如何确定少量有标记样本的高置信度点是算法的核心,它决定算法是否可以训练得到高性能的分类器。针对该问题,本文引入自然邻居的思想。自然邻居算法可以在没有人为干预的情况下找到数据点的邻居,在给定数据集上,对每一个数据点逐步拓宽邻域检测界限,自动学习邻域特征,进一步获取数据集合的整体分布结构。本文对自训练算法和自然邻居算法展开学习研究,创新点如下:1、在传统的自然邻居算法中,寻找数据集的近邻域非常耗时,需要逐步扩展近邻域,针对此问题,本文提出一种快速搜索自然邻居算法(FSNN),该算法通过逆向寻找数据集中最孤立的点,反向确定邻域的上限值,减少迭代搜索邻居的次数,达到提高搜索邻居效率的目的。通过与自然邻居算法进行对比,实验结果表明,FSNN算法不仅能有效地搜索邻居,而且能显著提高搜索速度。2、针对自训练算法中寻找高置信度点的问题,本文将快速搜索自然邻居算法与自训练算法结合,提出了基于快速搜索自然邻居的自训练算法(STAFSNN),该算法首先确定有标记样本的自然邻居作为高置信度点加入训练集合,然后利用分类器对这些点进行标记,同时用更新后的训练集训练得到新的分类器,直到未标记样本标记完为止。在UCI数据集上,本文将提出的算法与其他算法进行对比,实验结果表明,该算法可以准确寻找高置信度点,与其他算法对比具有一定优势。
其他文献
数控滚齿机床是传动关键零部件齿轮的工作母机,其能源消耗总量和二氧化碳排放量巨大,具有较大的节能减排潜力。能耗和碳排放的准确预测是研究如何优化的重要前提,然而现有研究大多从试验角度出发构建预测模型,随着人工智能的发展,国内外学者发现机器学习模型往往表现出更好的预测性能。但我国大多数普通企业尚未实现车间联网和制造数据的自动采集,使得机器学习方法的应用受到阻碍,如何从机器学习的角度出发构建预测效果更优的
随着现代工业技术的不断发展,对齿轮传动系统性能的要求也越来越高。作为特种车辆的传动系统,不仅需要在高速重载等极限工况下运行,也需要在其他转速转矩范围和复杂激励工况下平稳运行。因此,需要合理地控制齿轮传动系统的振动噪声,提高系统的稳定性和可靠性。齿轮修形是提高齿轮传动性能的主要途径之一,通过修形能减少齿轮的啮合冲击,改善载荷分布,从而降低系统振动响应。但相同修形参数在不同激励频率与转矩下会有不同修形
铜/钼/铜(Cu/Mo/Cu)层状复合板具有可调节的热膨胀系数和热导率、良好的力学性能,在电子封装材料领域有很好的应用前景。通过合理的轧制工艺制备铜钼复合板以及建立其组织与性能的关系一直是研究的难点。本文选择纯铜和纯钼作为原材料,采用不同的轧制工艺制备了铜/钼/铜复合板,研究了复合板的界面演变、协同变形规律以及由于协同变形引起的组元金属组织不均匀性。通过拉伸、热膨胀以及导热试验研究了复合板的力学性
数控机床是制造业的工作母机,是集机电液控为一体的复杂产品,国内数控机床产业主要是中低端机床产品,数控机床质量不高是制约数控机床走向高端的主要技术壁垒。数控机床质量分析存在多学科交叉、质量特性数量庞大且关系复杂问题,很难进行精细化控制。元动作单元是数控机床的最小运动单元,分析粒度适中且相互独立,其质量的优劣能直接体现数控机床整机功能和性能,而质量是通过质量特性进行表征的,因此对元动作单元质量特性进行
钢铁企业生产过程中伴随着能源消耗和环境污染,烧结作为钢铁生产的重要步骤,成为了能源消耗和环境污染的重要关注工序。随着近期碳达峰和碳中和日程的确定,烧结过程中的节能减排问题也被提上了技术开发日程。本文系统研究了原料条件、工艺参数及某些特定技术对铁矿石烧结过程CO排放影响规律,并提出了减少烧结CO排放的相关措施。论文的研究内容和结论如下。(1)在烧结制粒过程中,保证烧结原料具有良好透气性的前提下,含水
目前,随着笔记本电脑、手机等便携式移动设备的需求增加,对清洁、高效的电源设备提出了更高的要求。直接甲酸盐燃料电池(Direct formate fuel cell,DFFC)以其独有的室温启动、稳定高效、无毒害、燃料便于储存与运输等优势,受到了国内外学者的广泛关注。但DFFC结构中昂贵的离子交换膜与高载量的贵金属阴极催化剂使得DFFC成本居高不下。近年来,大量研究表明廉价的碳质催化剂对氧还原(Ox
作为21世纪的绿色工程材料,镁合金拥有高比刚度、高比强度、可回收利用、优良的电磁屏蔽性能以及资源丰富等优点,在航空航天、汽车工业、3C产品以及国防等领域广受青睐。但镁合金因自身化学性质和物理结构存在一些致命短板,如绝对强度低,室温塑性差,高温性能较差,进一步限制了镁合金在工业和商用产业上的大规模应用。因此提高镁合金室温和高温强度,改善镁合金塑性及加工成形能力逐渐成为材料学者的目标。根据国内外研究报
热电转换是分布式发电及废热利用中不可或缺的环节,而热电材料是实现热能向电能直接转换的关键材料,热电性能对热电材料的转换效率具有决定性作用。目前,碲化铋是室温下性能最好的热电材料,碲化铋纳米化有助于进一步提高碲化铋材料热电性能。但纳米碲化铋的制备周期长,制备过程中涉及强还原剂及有毒溶剂污染环境。本文以碲化铋为研究对象,采用溶剂热法制备碲化铋纳米片,并将纳米碳化钛薄片引入碲化铋纳米片基体,研究了碲化铋
贵金属及其合金由于具有良好的导电导热、化学稳定性以及合适的硬度与弹性,早期的电接触材料主要以贵金属及其合金为主。随着工业的快速发展,世界各国对贵金属消耗激增的现象日渐重视,低成本、高性能的层状复合电接触材料受到人们的关注。贵金属/廉金属层状复合电接触材料兼具贵金属优良的电接触性能以及廉价金属优秀的机械性能和导热性能,具有广泛的应用前景。本课题利用连轧加中间退火技术将C7701基带与AgPd30复层
由于石油等化石燃料的紧缺及对环境问题的影响,新能源汽车在各国得到发展。目前市场上较普遍的新能源汽车包括四大类型:纯电动汽车、混合动力电动汽车、燃料电池电动汽车和其他新能源汽车。其中,纯电动汽车具有能量利用率高、零排放等优点,近几年在世界各国得到迅速发展。而与同样大小的铅酸电池、镍镉电池、镍氢电池相比,锂离子电池电量储备最大,重量最轻、寿命最长、充电时间最短、无记忆效应,因此成为极有潜力的新一代二次