基于标签关系挖掘和利用的多标签分类方法

来源 :南京大学 | 被引量 : 0次 | 上传用户:shingohit
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在多标签分类的框架下,每个样本可以被赋予不止一个标签,直接导致样本的可能标签集合的数目巨大,给多标签分类中分类器的学习带来挑战。已有的研究表明,有效地挖掘并利用标签之间的关系可以促进多标签分类的学习过程,提升分类器的预测性能。但是,关于标签关系的挖掘和利用又不得不面临这样的两个问题:1)如何挖掘出标签之间的关系;2)如何恰当地利用标签之间的关系。此外,所有样本并不总是满足相同的标签关系,不同的样本子集包含的标签关系可能存在差异,直接假设特定的标签关系的效用范围是全部样本并不是十分合理的。针对以上问题,本文的主要工作有:1)针对多标签分类中潜在的相关标签集数目巨大的问题,可以通过挖掘和利用全局性的标签关系来缓解,提出了基于标签-主题对的多标签学习框架LTPML。LTPML将主题模型应用于标签关系的挖掘过程,将单个示例视为一篇文档,将每个标签视为一个词,学习出标签层上包含标签关系的更凝练抽象的主题信息。将每个标签与每个主题进行配对,基于构成的标签-主题对得到对应的重构数据集,从而将多标签问题分解为多个单标签问题进行求解。基于学习框架LTPML,根据主题组合方式以及主题数目的不同,分别提出了具体的算法LTPML-α和LTPML-β。相关实验探究了 LTPML-α和LTPML-β各自的性质,说明了主题组合方式以及主题数目的选择对算法的影响,实验结果也验证了框架以及具体算法的鲁棒性和高效性。2)基于实际多标签分类场景中存在的特定的标签关系并不总是被全部样本所共享,不同的标签关系会有着各自的效用范围的事实,提出了基于局部标签关系自适应挖掘和利用的多标签分类算法LCMLS。LCMLS根据样本特征以及标签之间的相似性将所有样本划分到不同的样本子集中,然后基于每个样本子集,引入标签筛选和集成学习机制,学习能够适应当前样本子集包含的标签关系的多标签分类模型。相关的实验结果验证了 LCMLS算法的可靠性和有效性,探究了可选参数对算法性能的影响,证明了假设特定的标签关系的效用范围可以是局部样本的合理性。
其他文献
肿瘤免疫治疗是当今科学界重点关注的领域之一。在免疫检查点疗法中,CTLA-4抗体和PD-1/PD-L1抗体均已在临床上获得了重大成功,而吲哚胺2,3-双加氧酶1(IDO1)作为抑制性检查点分子也成为现今肿瘤免疫治疗的研究热点,被认为是一种具有潜在价值的相关治疗靶标。目前仍有多个IDO1抑制剂开展临床实验。IDO1是催化犬尿氨酸途径中第一个限速步骤的三种酶之一,通过限制T细胞功能、参与免疫耐受机制以
学位
哈罗德·品特(1930-2008)是2005年诺贝尔文学奖得主,其戏剧创作拥有鲜明的风格且自成一派,被学者们称为“品特式戏剧”。品特一生创作戏剧近50部,这些作品聚焦人类生活的痛苦和磨难,每一部在思想内容和艺术形式上都有作家的尝试和创新。品特在其后期创作的戏剧《归于尘土》中,试图通过主人公瑞贝卡的个人生活经历来呈现大屠杀惨绝人寰的场景以及大屠杀对她造成的心理创伤。瑞贝卡身份的特殊性在于,她并未亲历
学位
匾联艺术是中国文化的特殊载体之一,是中华民族特有的艺术典范。匾联在我国古代建筑具有画龙点睛的作用,匾联既有书法艺术的韵味,又有文学的点明主旨;既有托物言志的文学性能,又有点染美化建筑的外在环境。本文通过文献整理和实地考察,以王家大院为背景,作为曾经的名门望族之所居,留下了大量的文人墨迹,其中匾联艺术起到了“画龙点睛”的作用,是王家大院特有的艺术珍宝,楹联艺术蕴含着浓厚的书香气息,将书法艺术展现的淋
学位
报纸
视频目标跟踪任务是使用第一帧中已经标记的目标区域信息,自动化地预测后续帧中的目标区域信息,这些信息包括了目标区域的位置和大小。近年来,随着计算机视觉技术的不断发展和高性能便携式设备的普及,目标跟踪技术在诸如视频直播、虚拟现实、交通监控等领域发挥了重要作用。不过,在诸如遮挡、光照变化、快速运动等复杂条件下,目标跟踪的效果仍有待提升。同时,随着跟踪技术的应用愈加广泛,如何在诸如海上船只监控、道路交通监
学位
乡村旅游地是一个复杂的“自然—社会—文化—生态”地域综合体,它在促进当地经济发展的同时也给当地自然生态环境带来一系列负面影响,造成环境质量的下降。同时,乡村旅游发展过程中涉及多个利益相关者,如政府、企业、经营户、游等客,各利益相关者扮演的角色不同,对旅游发展的需求也不同。而旅游生态补偿是一种市场化的补偿手段,它能够在相关利益者之间建立起一种制约机制,也能够弥补生态保护过程中的财政缺口,最终实现旅游
学位
目前,神经网络被广泛用于图像数据分析领域。神经网络通常规模较大,运行时占用大量计算资源,难以在内存和算力受限的移动端设备运行。然而在移动端使用神经网络的方法用于图像数据分析的需求日益旺盛。轻量级网络架构研究致力于在保持网络预测性能的同时,减小网络模型的规模和计算量,使得神经网络模型可以在移动端设备上运行。基于此,本文分别从低层内容恢复、高层语义理解两类图像数据分析任务出发,研究如何将轻量级神经网络
学位
<正>在放假在家的日子里,我认真读完了日本作家、联合国儿童基金会亲善代表大使黑柳彻子所著的《窗边的小豆豆》,并深有感触。这本书讲述了作者上小学时的真实故事:小豆豆因淘气被学校退学之后,来到了巴学园。小林校长却常常对小豆豆说:"你真是一个好孩子呀!"在小林校长的爱护和引导下,一般人眼里"怪怪"的小豆豆逐渐变成了一个大家都能接受的孩子,并奠定了她一生的基础。
期刊
依法治国是国家治理体系和治理能力的重要支撑,是检验国家治理实际效果的重要标准,是促进国家治理现代化的必然趋势。新时代法治文化建设不仅依赖法律的权威,更依赖法治文化的支撑。从实化价值、优化价值、淳化价值三个层次,探讨国家治理现代化下法治文化建设的三重价值意蕴,为推进国家治理体系和治理能力现代化提供现实借鉴。
期刊
学位