【摘 要】
:
多标记学习及其应用是当前机器学习和数据挖掘领域研究的新的热点问题之一。多标记学习中的训练数据集是由多个标记的示例组成,多标记学习的任务就是通过对已知类别标记的示例
论文部分内容阅读
多标记学习及其应用是当前机器学习和数据挖掘领域研究的新的热点问题之一。多标记学习中的训练数据集是由多个标记的示例组成,多标记学习的任务就是通过对已知类别标记的示例进行分析从而预测未知示例的标记。多标记学习在文本分类、web网页分类、自然场景分类以及生物基因功能分类等领域都有广泛的应用。因此,研究多标记学习具有一定的现实意义和应用价值。学者已经将许多数据挖掘中的有效算法应用在多标记学习框架下。例如,神经网络、ID3算法以及KNN方法应用在多标记学习框架下,但仍然有些问题值得我们去研究。本文主要是研究Apriori算法和贝叶斯分类器在多标记学习中的分类问题。前者是研究多标记的各个类别标记之间的关系,后者是将传统的朴素贝叶斯分类器推广到多标记学习中。首先提出了用Apriori算法挖掘标记之间的关联规则。在标记过程中,将具有强关联依赖关系的复杂标记用依赖关系中的单标记表示,然后用ML-KNN算法对多标记数据进行分类。在最后的标记预测阶段,再根据强关联依赖关系填补上复杂标记。实验结果表明,在对emotions数据集的分类中,这种方法比现有的多标记分类方法更有效。针对多标记学习的特点和评价指标,提出了多标记朴素贝叶斯分类器来为多标记数据进行分类。在数据预处理阶段引入了主成分分析方法,对多标记数据集的特征向量进行维度归约,减少了实验的运算量,提高了分类器的分类准确性。然后将这种方法推广应用在基于互信息和条件互信息测度的树扩展的贝叶斯分类器TANC中。最后多标记朴素贝叶斯分类器是在MBNC实验平台下实现的,并将其应用于自然场景数据集的学习中,实验结果表明多标记朴素贝叶斯分类器能有效进行分类。
其他文献
自Google于2004年底发布了与世界五大图书馆合作的数字图书馆计划以来,引起了图书馆界、出版界、互联网信息服务业以及以法国为代表的欧洲政府的一系列连锁反应,引发了有关图
目前全党正在深入开展以为民务实清廉为主要内容的党的群众路线教育实践活动,党员干部怎么办?坚持党的群众路线,必须坚持两条根本的原理——相信群众、相信党,就是在实际工作
民间游戏以其独有的特性,在丰富和完善幼儿人格的内涵、经验及促进幼儿智力、身体健康发展的同时,充分地满足了不同幼儿的不同发展需要,受到了孩子们的青睐。幼儿园应大力开
<正>中药气雾剂系指药材提取物、药材细粉与适宜的抛射剂共同封装在具有特制阀门装置的耐压容器中,使用时借助抛射剂的压力将内容物喷出呈雾状、泡沫状或其他形态的制剂。不
目的了解小儿先天性心脏病关于病因及治疗方面的研究进展及存在的问题。方法回顾分析我院2001~2009年的146例先天性心脏病患儿病例,比较手术前后心功能及不良症状。结果 146例
指出了目前行业内液压支架多样性的现象,分析造成这种现象的原因,同时对液压支架多样性的负面影响进行了分析。对液压支架进行标准化研究,制定了实施方案及部分具体做法,提出
目的比较分析轮状病毒感染个体与健康个体肠道菌群结构的差异。方法采集11例轮状病毒感染个体及6例健康个体的粪便样品,提取粪便样品中细菌的混合DNA,先通过ER IC-PCR结合分
目的 :对老年人感染性疾病抗菌药物进行药物利用研究 ,以期找出规律 ,指导合理用药。方法 :采用回顾性调查 ,将1 990~ 1 996年我院≥ 6 0岁老年人因感染性疾病死亡的全部住院
DNS是Internet重要的基础设施,除基本的域名服务外,DNS在负载均衡、移动IP等方面也有着重要的应用。本文分析了DNS服务及应用所面临的安全问题,重点探讨了DNS体系结构的弱点,
用液相沉淀法制备得到掺稀土离子Er3+和Ce3+的NaAl(MoO4)2,X射线衍射图样显示NaAl(MoO4)2是单斜晶体结构。掺稀土离子Er3+和Ce3+的NaAl(MoO4)2的拉曼光谱研究表明,掺Er3+离子