基于不完整标签信息的多标签分类问题研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:yeyeye5122
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多标签学习普遍存在于实际应用中并且是机器学习领域里研究的主要问题之一.与传统的单标签学习不同,多标签学习能够处理具有多个类标签的实例,同时在测试阶段它可以为新出现的待测实例一次预测一组相应的标签集合.对于多标签学习来说,拥有大量标签信息完整的训练数据是获得较好学习性能的前提条件.然而在实际问题中,由于数据规模庞大、类型繁多、标记不易等原因,获得的训练数据常常是大量含有不完整标签信息的弱标记数据.如何利用这些弱标记数据来执行分类任务并取得不错的分类效果逐渐成为了研究的热点问题之一.本文针对在多标签分类过程中遇到的两种不同类型的弱标记数据进行研究,主要的工作如下:首先,对于训练数据中只有部分相关标签信息被标记的弱标记数据,本文提出了一种适用于此类型弱标记数据的多标签分类算法.该算法通过迭代更新每个实例的权重值以及利用任意两两标签之间相关性来恢复其中不完整的标签信息;在标签恢复完毕后,利用标签信息完整的训练集来训练分类模型,并且用此模型对测试集进行预测.在实验阶段,将该算法与其它相关算法在多个公开的多标签数据集上进行实验仿真,实验结果表明所提算法在标签恢复方面和最终的多标签分类方面均取得了较好的效果.其次,对于训练数据中含有部分标记和完全未标记实例的弱标记数据,本文提出了一种适用于此类型弱标记数据的半监督多标签分类算法.该算法先将部分标记实例中缺失的标签信息恢复完整;随后通过标签传播的方式,将恢复好的这部分实例的标签信息传播给完全未标记的实例;之后用所有的实例(包括训练实例和测试实例)来训练一个基于图的半监督线性分类器,并用此分类器来预测测试实例相应的标签信息.在实验阶段,把该算法在多个公开的多标签数据集上进行实验仿真,并与现有的相关算法进行对比和分析,进而说明所提算法的有效性.最后,本文对研究内容与所获得的研究成果进行了简要总结,同时对下一阶段的研究做出了规划与展望.
其他文献
马铃薯干腐病会导致马铃薯在窖藏过程中发生腐烂,影响薯块的商品价值和食用价值。黄色镰刀菌(Fusarium culmorum)为黑龙江省马铃薯干腐病的主要致病菌。为观察镰刀菌对马铃薯
本文介绍了国家体育场工程中预拌砂浆的使用情况,比较全面地分析了使用预拌砂浆所带来的综合效益,并提出了推广预拌砂浆的建议。
本文研究找出一个已知的线性齐次递推数列的一般项的基础解组的问题。作者根据有关资料完全地解决了这个问题。作为所得的主要结果的一个应用,给出了一个常系数线性齐次微分
通过对汽车牵引力、ABS制动系统、汽车尾翼三个力学问题的分析,让我们更好地理解汽车的工作原理,同时也让我们理解力学知识在现实生活中的广泛用途。
春季水温不稳定,藻类生长相对缓慢,养殖动物开始摄食。因价格及规格因素,部分鱼塘年底不会清塘卖鱼,这些鱼塘就要面临春季管理问题。春季要综合做好水质管理,方能保证养殖顺
期刊
在刑事审判过程中附带解决民事问题,具有提高诉讼效率、维护当事人合法权益的价值,但在被告人不构成犯罪的特殊情况下,附带进行的民事诉讼将出现程序运行复杂、实体权利救济
<正>在刘晓光眼中,做一个专业"吃"垃圾的公司很美、很好、很强大"这哪里像一个垃圾填埋场,倒像一个山野公园。没有异味,空气还那么香甜。它已经填埋了240万吨的垃圾。除臭的
为提高Savonius风力机效率,提出一种基于多次Bezier曲线的Savonius风力机叶片设计新方法,通过调整设计公式中4个设计参数(叶片弦长L、叶片顶点偏向控制系数k_x、叶片顶点高度
目的:观察外源锌对原发性肝细胞癌(HCC)BEL-7404细胞生物学行为的影响。方法:应用TSQ锌离子荧光探针、MTT法、DNA倍体法、吖啶橙/溴乙啶双荧光染色法和Transwell小室法分别检
案例$$ 2013年初,引人关注的PE界首例“对赌”大案终获定论。$$ 2012年5月,《21世纪经济报道》曾率先报道,PE机构苏州工业园区海富投资有限公司与被投公司甘肃世恒有色资
期刊