非参数边际距离最大化准则及其应用

来源 :复旦大学 | 被引量 : 0次 | 上传用户:hf2562
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
维数灾难问题是许多模式识别方法在实际应用中面临的主要问题,比如文本处理,图像识别。在低维空间里解析上或计算上行得通的方法,在高维空间里往往行不通。因此,降低维数有时就成为处理实际问题的关键。特征提取的任务就是求出一组有效的特征,把数据从高维空间变换为低维空间。 线性鉴别分析是最有效的线性特征提取和维数减少方法之一。线性鉴别分析方法的目标是通过最大化类间散度矩阵S_b,同时最小化类内散度矩阵S_w来提取特征。在许多应用中,线性鉴别分析被证明是十分有效的。但是线性鉴别分析依然存在缺陷:一是当样本维数很高时,类内散度矩阵为奇异的问题;二是它假设各类都属于Gaussian分布,并且各类的协方差矩阵相同,但一般情况下数据不满足这样的假设。 本文中,我们提出一种新的非参数边际距离最大化准则的特征提取方法,非参数边际距离最大化准则是一种从最近邻分类器的角度提出的线性特征提取方法。它不存在类内散度矩阵的奇异问题,也不需要假设每个类服从特定的分布。然后我们提出一种维数递减的优化算法。 我们成功地将非参数边际距离最大化准则应用于人脸识别,效果要好于目前流行的特征提取方法。 最后,我们进一步扩展非参数边际距离最大化准则,从信息论的角度提出信息边际距离的概念。我们同样不假设样本属于某个特定的分布,用非参数密度估计方法得到每个样本在不同类别里的概率密度,我们的目标是最大化类与类之间的相对熵,并且同时最小化每类样本的熵。实验证明,信息边际距离最大化准则要比互信息最大化准则和其它线性特征提取准则更有效。
其他文献
全球化背景下青年的爱国主义教育面临着新的挑战。我们应积极应对这种挑战,充分认识全球化进程中爱国主义教育的必要性和重要性,探索爱国主义教育新的特点和规律,切实增强爱
以上海市大型商业建筑和酒店建筑能源消费调研数据为例,结合上海市公共建筑能耗基准线,对上海市公共建筑能源消费特征及其水平进行分析。结果表明,2012~2014年上海市大型商业
针对现阶段中等职学校《计算机组装与维护》课程教学的现状、存在的问题、论述了教学更新的必要性,并根据社会需求和学生实际对一些新的计算机教学理念、实训模式、学习评价方
企业应用集成(Enterprise Application Integration,EAI)是一门新兴的技术,应用于异构企业应用系统之间的互操作。它通过实现应用系统之间的无缝集成消弭信息孤岛,保护企业已有
目前我国社会冲突的治理是由政府单一主体把控的,从中央到地方强调"谁主管,谁负责",社会组织尚未成为有效的社会冲突治理主体。这是一种缺乏结构洞、网络密度大、群集度高的
<正>在线教育未来如何发展取决于两方面:一是行业自身的规范发展,包括建立准入门槛,明确从业标准,加强行业自律;二是我国教育改革能否落实高质量的素质教育,建立科学合理的评
<正>资产评估的内涵一是资产评估的主体是评估机构及其评估专业人员。评估机构是依法设立的从事资产评估业务的专业机构,评估专业人员包括评估师和其他具有评估专业知识及实