【摘 要】
:
在传统监督学习中,一个样本通常对应单个标记,提供了明确的监督信息。在偏标记学习中,一个样本对应一组候选标记,其中仅有一个标记为真且未知。单标记样本更有利于模型训练,但获取代价较高;偏标记样本真实标记对模型不可见,训练更具挑战性,但获取成本相对较低。本文对偏标记数据利用进行研究,主要做了两方面工作。一方面,本文将偏标记数据作为单标记数据和未标记数据的桥梁,提出了一种新型半监督学习方法Eupal。该方
论文部分内容阅读
在传统监督学习中,一个样本通常对应单个标记,提供了明确的监督信息。在偏标记学习中,一个样本对应一组候选标记,其中仅有一个标记为真且未知。单标记样本更有利于模型训练,但获取代价较高;偏标记样本真实标记对模型不可见,训练更具挑战性,但获取成本相对较低。本文对偏标记数据利用进行研究,主要做了两方面工作。一方面,本文将偏标记数据作为单标记数据和未标记数据的桥梁,提出了一种新型半监督学习方法Eupal。该方法采用一种新的未标记数据利用机制,尝试估计包含未标记数据真实标记的候选标记集合,而非未标记数据的单个真实标记,从而降低未标记数据标记信息估计的难度。基于此,Eupal采用已标记样本与估计得到的偏标记样本分别构建多类分类器,并通过二者的标记信息交换实现模型更新。实验结果表明,Eupal方法可有效利用偏标记数据提升半监督学习系统的分类性能。另一方面,针对多标记分类面临的类别不平衡与标记含噪问题,提出了偏多标记类别不平衡学习方法Ipml。该方法综合考虑多标记样本与偏标记样本特性,基于k近邻聚合对偏多标记数据进行消歧,由此提出随机过采样、权重过采样以及合成过采样三种数据层面的类别不平衡处理机制。在人造及真实数据集上的实验结果表明,Ipml方法可有效缓解偏多标记学习面临的类别不平衡问题。本文共含四章。第一章节介绍偏标记学习的背景、研究现状以及待解决的问题,第二章介绍半监督偏标记数据利用方法Eupal,第三章介绍类别不平衡偏标记数据利用方法Ipml,第四章总结全文。
其他文献
被编选入高中语文教材中的文言作品都是文质兼美、千古流传的文学经典,通过对这些文章的探究学习,学生可以体悟作者的情感,丰厚文言知识的积累。新时代要求我们树立文化自信,学生在学习文言文的过程中可以潜移默化地汲取传统文化养料,继承和弘扬中华传统文化,提升自身文学素养和人文情怀,从而培育学生的文言语感。时代发展日新月异,教育改革也不断创新,从目前使用的2019版普通高中语文统编教材分析情况来看,文言文仍在
语文教材是语文课程内容的集中表达,在语文教学中发挥着不可估量的作用。而作为小学语文教材重要组成部分的儿童文学选文,其选编方式将直接影响语文的教学质量,特别是对于一二年级正在打基础的学生来说,对他们的学习和身心发展具有长远的影响。基于此,本文通过文献研究法、比较研究法、归纳研究法、内容分析法,对《开明国语课本》和部编本两个不同时代的小学语文教材1-4册中的儿童文学选文进行了全面而深入的比较研究,并得
新课程理念提倡教师挖掘新的课程资源。绘本是现代教学重要的课程资源,如何更好地进行绘本教学已成为一个重要课题。绘本是17世纪诞生于欧洲的读物,后在世界范围内流行。我国在引入绘本后,进行了一定规模的研究。尤其是本世纪初期,大量的绘本研究取得了不错的成果。但是,一般绘本教学的研究大多脱离现行教材,广大教师未能积极探索绘本作为课程资源与教材的结合。本文旨在研究绘本教学的理论和模式,厘定“指向学科素养的绘本
阅读和写作,是语文教学的“一体两面”,两者有着相辅相成、相互促进的紧密联系。但如今语文教学的过程中往往会割裂两者的联系,把阅读和写作当作互不相干的两个模块分别进行教学。就目前看来,写作教学还有一些问题存在,写作仍是学生在语文学习中的一大难题,故通过阅读教学来促进学生写作训练、提高学生写作能力变得尤为重要。所以本论文旨在以部编版初中语文教科书为材料,通过探寻现当代散文阅读教学促进写作训练的有效结合点
大数据时代,数据和创意是推动数字经济的根本动力,平台用户的“玩乐”活动为互联网行业创造了大量的财富。本文从产业价值视角探讨:网络用户如何推动互联网产业发展,创造了何种价值。文章采用民族志和案例分析等方法,并在文献综述和概念梳理的基础上,提出数字劳动是网络用户在虚拟空间进行非特定目的活动而产生价值的过程。数字劳动的出现有其内在动因,数字技术的发展,使“劳动社会化”即“随时、随地”劳动成为可能。数字劳
新媒体环境对纪录片的创作提出了新的要求。交互纪录片作为纪录片艺术在新媒体环境下衍生的一种新形态,不仅在表现形式上进行突破,更能在技术层面接近受众,在受众心理和认知层面打动受众。毕业作品《别样的大学“独立学院”》,通过人机对话和超文本链接的交互原理设置网页构建、导航和浏览、页面跳转、散点分布纪实影像等交互行为模式,赋予受众部分参与到作品建构中的权利,成为作品的生产者,实现用户与作品的交互关系。本文从