基于维度约简的多标记学习

来源 :安庆师范大学 | 被引量 : 1次 | 上传用户:kingknife2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多标记学习作为当前机器学习领域的研究热点,在实际应用中,为了提高多标记学习算法的分类性能,需要采集大量的特征。然而,过于繁多的特征则会引起维数灾难,分类困难的问题。因此,如何有效约简高维数据,对提升分类精度有着重要的意义。此外,以往多数维度约简算法均是依靠特征间的依赖关系评估特征的好坏,而很少有利用特征集合之间相似度程度作为衡量特征好坏的标准。基于此,本文提出两种多标记维度约简算法,主要内容如下:  1.判别嵌入式聚类(DiscriminativeEmbeddedClustering,DEC)算法是一种集维度约简与聚类的整合框架。考虑该方法在数据降维方面的有效性,本文将DEC算法应用到多标记数据特征降维中,提出基于DEC算法的多标记学习。该算法结合子空间学习与聚类的算法,有效避免了其它维度约简算法因矩阵奇异而无法求解的问题。实验与当前广泛使用的5种维度约简算法对比,结果表明基于DEC算法的多标记数据维度约简是可行的,其有效提升了多标记数据的分类性能。  2.尽管DEC算法对多标记数据的维度约简是有效的,但该算法并没能充分考虑特征与标记集合以及特征与特征之间的关联度。因此,针对DEC算法以及过往算法的不足,本文提出一种改进的基于互信息的多标记特征选择算法。首先,利用交叉相似度(intersectionsimilarity)的思想计算特征与特征之间的相似度,从而剔除冗余特征;然后利用特征与标记集合之间的互信息,提取相关特征序列;最终有效整合这两种思想,并利用平衡参数α控制两项之间权重,以选择与类别标记最大相关而与其它特征集最小冗余的一组特征序列。基于8个公开数据集的实验结果,证明了该算法的有效性。
其他文献
中国股票市场的大起大落现象,以及2007.5.30上调印花税引发的股市短期暴跌事件,已无法从有效市场与理性人为假设的标准金融理论得到满意地解释。  本文首先,从金融计量经济学
目前我国社会经济处在一个高速发展的时期,国家提倡发展多种经济形势,市场上各种性质的企业随之诞生,而影响企业发展的因素众多,其中就包括企业的合同制定,企业合同一旦出现
新时期背景下,互联网快速普及,信息技术日新月异,由此给人们工作及生活带来了巨大变化,新媒体崭露头角并迅速发展.互联网给新媒体营销提供了思路及方式上变革创新的机遇,立足
我国社会经济的快速发展,促进了我国电子商务领域的迅速崛起.目前,各行业领域都在广泛的应用电子商务,随着社会需求的日益增加,对电子商务专业人才提出了更高的要求.然而,我
上个月最火的可能就是我的广告,面授十万元,一分不少。什么技术这么牛,敢开这个价。“孙老师,我非常想去面授,但是我话讲在前头,如果技术没有用,我会去工商局投诉,去派出所报
互联网时代定制营销成为当前营销的主要发展趋势,如何在定制营销浪潮中赢得先机成为现今营销学研究的热门话题.本文旨在厘清我国定制营销的发展起源、现存的问题,并进一步针
当前铁路基础设施建设的大刀阔斧推进,要求对沿线土地的综合开发投入高度的关注,从而抓住铁路建设发展机遇,带动区域经济的蓬勃发展.基于此,本文将围绕当前铁路沿线土地综合