一种利用类标号关系的多类标号分类算法

来源 :郑州大学 | 被引量 : 0次 | 上传用户:huangjl41
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的分类问题中,一个实例只和一个类标号相关联,但是多类标号分类问题中,一个实例可以和多个类标号相关联,所以,与单类标号分类问题的任务不同,多类标号分类的任务是为一个新实例预测一个合适的类标号集合。目前,如何充分利用类标号之间关联关系是多类标号分类问题成功的关键,但是,已有的多类标号分类方法往往认为类标号之间是相互独立的,忽略了类标号之间的关联关系,失去了大量的可利用信息,严重影响了分类器的性能。为了解决上面提到的问题,本文提出了一种新的多类标号分类方法(multi-label classification by exploiting relationship of labels,简称MCER)。该算法有效的利用了类标号之间的关联关系,MCER算法有两个关键步骤:(1)在原类标号集合中加入一个虚拟类标号,然后为每一对的类标号学习一个分类器。虚拟类标号主要用于预测过程中。(2)在为一对类标号学习分类器时,MCER算法以互信息为标准选择与待学习类标号对关联程度较大的类标号,并视它为一般的特征属性。在预测阶段,MCER算法得到对每一个类标号的投票数,并根据虚拟类标号的投票数(阈值)对未见样本进行预测。实验结果与分析表明,在大部分数据集上,MCER算法表现出显著优势。本文的研究内容可以应用在很多领域,如文本分类、基因功能的预测以及对图片和音频的语义标注等众多领域。对于加快各个领域的发展具有十分重要的意义。
其他文献
社会保险审计是关乎国计民生的重大事情。有效的审计措施能够及时发现社会保险缴纳是够违规,来维护劳动者的合法权益。目前审计手段主要有人工审计和计算机审计。其中人工审
计算机网络已经潜移默化地改变了人们的生活方式,人们在享受技术进步带来的便利的同时,逐渐地对远程平台的安全性提出了质疑。为保证计算机网络提供服务的同时具有较小的安全
移动机器人三维环境建模有着重要的研究价值和广阔的应用前景。在军事上,三维地形可视化能力可以为作战提供重要情报信息。在对未知或危险环境进行探索时,如进行太空、海底、
伴随着网络用户的急剧增加,网络拥塞控制问题显得越来越重要。然而传统的TCP拥塞控制协议是基于端系统的流量控制的,它们已经无法适应这些变化。微观经济学中效用和价格概念
Linux集群系统以其良好的性能得到了广泛应用,但是其存储系统的I/O效率严重制约着系统整体性能的提升,对于石油勘探中的地震资料处理这类巨量计算、海量存储的应用,系统的I/O
车辆匹配是智能交通系统的重要组成部分,其在停车场智能管理、道路监控、高速路自动收费、超时停车检测、以及高速公路服务区、停车场等场所的出入口车辆比对等处都有着广泛
动态三维物体的实时建模是当前计算机视觉、图形图像等领域的研究热点,旨在通过一定的方法和手段实时获取三维物体的多模式信息,并由此重建出其对应的三维模型。实时建模对三
随着科学技术的发展以及信息化的推进,计算机的应用领域越来越广阔,尤其是软件的发展使得软件产品成为各行各业不可或缺的工具。然而,随着软件功能的提高,软件的复杂性也随之
计算机网络的出现极大方便了人们之间信息的传输与获取,但也造成了数字化作品版权失控的问题。数字水印技术的产生,为多媒体数据版权保护、内容认证及操作跟踪的研究开拓了新
文本特征提取是从文本信息中抽取能够代表此类或某文本的信息。特征提取方法研究的目的是过滤数据噪音特征、选择最优的特征子集来优化文本的表示,实现文本数据降维并提高降