面向有限标记数据的高性能学习算法研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:andy630767963
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如今,机器学习模型在解决各种实际应用时表现出了强大的能力,例如图像分类、机器翻译、语音识别等。然而,训练一个性能卓越的模型需要大量的标注数据和计算资源,这使得当有标记数据严重稀缺时,机器学习方法的性能会受到严重影响。为了减少标注的代价,模型复用和半监督学习技术被广泛的使用在实际中并取得了显著的效果。然而,对于希望部署机器学习模型的用户来说,这两大技术仍然具有局限性:1)模型复用对机器学习模型性能的提升有限;2)半监督学习中的神经架构需要专家调优。本论文围绕着两个问题,主要取得了如下新进展:1.本文提出了一种基于主动模型复用的快速性能提升方法Ac MR。与直接的模型复用不同,在目标任务中标记的例子不足时,Ac MR通过预训练模型来充当样本从而帮助增强主动学习器。另一方面,与只使用目标任务信息的传统主动学习不同,Ac MR利用预训练模型省去了传统主动学习不必要的查询,因此与传统主动学习相比节省了大量的查询。最后,在学习过程中,预训练模型与目标任务之间的关系不断更新,从而能够更准确地预测未标记的样本。理论分析保证了Ac MR方法的有效性,并且在三个迁移数据集的实验结果验证了Ac MR的性能明显优于直接模型复用和主流的主动学习方法。2.本文提出了一种基于架构优化的深度半监督学习方法DSSLAO,该方法的优势取决于以下三个方面。首先,充分利用了可微分的架构搜索的优势,从而为深度半监督学习提供了一种高效的架构优化而不需要专家调优。此外,DSSLAO还引入了架构梯度的无监督损失项,帮助神经架构向更精确的方向优化。最后,DSSLAO通过增加未标记验证数据和其增强验证数据之间的一致性损失以提供一种更好的神经架构性能度量,鼓励搜索到的神经架构具有更好的泛化性能。在两个常用的NAS基准数据集、CIFAR10和SVHN数据集上的大量实验结果验证了DSSLAO的有效性,它显著提升了深度半监督学习的性能。
其他文献
氢气作为一种清洁能源,是传统化石燃料的有效替代品。电解水制氢是一种有效的制氢方法。尽管贵金属铂基材料在电解水析氢反应中表现出良好的催化活性,但其昂贵的价格和有限的储量极大地限制了其商业应用。因此,研究开发高效廉价的非铂基析氢催化剂是实现电解水制氢广泛应用的关键。目前,研究人员已开发出多种非铂基催化剂,但其性能与铂基催化剂相比仍有较大差距。在此基础上,本文对过渡金属氮化物催化剂的制备及其在碱性析氢中
机械零件最常见的失效形式是疲劳断裂,疲劳断裂也是航空发动机叶片常见的失效形式,且现代社会对飞机的飞行性能有很高的要求,这需要航空发动机提高其推力和推重比,因此对叶片等薄壁零件提出了包括疲劳寿命在内的更高的使役要求。疲劳裂纹多起源于零件表面,而表面强化处理技术可有效提高零件疲劳寿命,提高零件的使役性能。激光冲击强化技术(Lasershockprocessing,LSP)技术是最新且高效的表面强化技术
能够发出特定白光的标准白光源作为物体颜色评价的基准,在颜色传感领域中的地位举足轻重。对于具有标准白光发光性能的新型发光材料(如白光LED)的研究,对颜色传感领域的发展也有非常大的益处。而稀土掺杂玻璃作为一种具有优异发光性能的荧光材料也备受关注,在发光领域有非常多的研究。在本课题中,我们研究了Dy3+掺杂的Zr F4-Ba F2-Al F3-Na F(Dy3+:ZBAN)玻璃的白色发光特性。主要的研
深度神经网络在许多复杂应用场景中证明了其替代人类智能进行决策的潜力。信息物理融合系统中大量嵌入了深度神经网络控制器进行智能控制。深度神经网络黑箱本质、神经元数量大和非线性的特征,使得对其行为进行理解和分析非常困难。特别的,如何确保深度神经网络控制的安全攸关系统满足必须的安全性质,成为迫切而又极具挑战的难题。基于混成系统为安全攸关信息物理系统建模,运用形式化验证技术分析验证系统的行为是否满足安全性质
太赫兹因为其透射能力以及低单光子能量等特性,常用于太赫兹成像,其成像技术已经在无损检测、安检等方面拥有广阔的应用。然而,与X射线相比,太赫兹虽然具有安全性高的优点,但因为其波长比X射线长,导致其所成图像模糊。为了解决相比于焦平面处图像更模糊的离焦图像去模糊问题,文本在太赫兹调频连续波成像系统的实验条件下,使用基于深度学习的图像去模糊算法提高图像的空间分辨率。根据图像模糊模型,研究了太赫兹离焦图像的
随着城市化进程的不断加快,有限的土地资源难以满足社会发展的需求。高层、超高层建筑实现土地资源高效利用的同时带来了深基坑工程的施工问题。如何确保基坑施工过程中的安全成为地质与岩土工程工作者研究的热点和难点。基坑的支护结构是保障基坑安全的重要组成部分,其中,混凝土支撑和地下连续墙应用广泛。因此,对于混凝土支撑轴力的测试技术研究具有重要的现实意义。论文基于课题组高精度光纤测试技术的研究成果,对混凝土支撑
磨削加工是用来获得高精度工作表面的精加工工艺之一。影响零件表面质量的因素除了设备和工艺参数外,振动也是主要因素之一。磨削过程中的振动形式主要为受迫振动和自激振动,发生在砂轮与工件之间的自激振动称为磨削颤振。颤振会使系统动态特性发生改变,同时,动态特性会以磨削力和磨削深度的形式影响磨削接触区的温度场分布,而温度场的分布又是金相组织转变的关键因素。磨削淬硬加工是工件表层金相组织随着接触区温度变化,先奥
随着生物质应用的快速增长,一些磷含量较高的生物质的资源化应用受到愈来愈多的关注。热解可同时制备碳、气、油产品,具有较高的能源转化效率和市场应变能力,是含磷生物质的一种极具潜力的利用方式。但当前磷对生物质热解基本特性影响研究还不够深入,磷添加对热解碳气油产率及产品组成特性的影响机理有待深入研究。鉴于此,本文选取三种磷酸盐作为添加剂,使用固定床反应器进行了不同磷酸盐作用下玉米秸秆的热解试验,研究了磷酸
学位
下扬子区中上二叠统发育含硅质岩富有机质黑色岩系,是页岩气勘探的重要的目的层段,而含硅质岩层段包括孤峰组和大隆组,但对硅质岩的硅质来源、成因和构造环境的认识仍存在较大分歧,使得难以精确评价中上二叠统硅质岩页岩气潜力。本文以下扬子区港地1井孤峰组和宣城牛山剖面大隆组为主要研究对象,通过野外实测、岩芯观察、岩石薄片鉴定、主微量元素、XRD、有机地球化学等多种分析,对孤峰组和大隆组硅质来源、硅质岩成因和硅