基于特征评价的模式识别算法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:mjc198603
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
欧氏距离是模式识别算法中最常采用的相似性计算量度。在计算数据间相似度时,欧氏距离为所有特征赋予相同的重要性,但是这与实际情况不符。尤其当特征维数较高时,大量不相关特征会影响欧氏距离计算的准确性,从而影响模式识别算法的性能,产生维数灾问题。通常维数灾问题通过特征选取算法解决。但是特征选取算法仅适用于解决特征与类存在较高相关性或者完全不相关的情形。本文通过特征评价解决特征与类存在不同相关度的维数灾问题。针对模糊C均值算法的维数灾,提出了基于函数CFuzziness的特征权重的学习算法。特征权重学习算法为每个特征赋予一个权重,区分其对聚类的贡献。合理的权重值使得相似的数据彼此更靠近,不相似的数据相互远离,此时的聚类结果好。通过梯度下降算法极小化函数CFuzziness就可以为每个特征赋予一个合适的权重值。权重应用于模糊C均值算法,得到加权模糊C均值算法。加权模糊C均值算法强调重要特征的作用,消减冗余特征的作用,从而得到较好的聚类结果。实验表明,加权模糊C均值算法的聚类结果优于模糊C均值算法的聚类结果。针对最近邻分类器的维数灾,提出了两种特征子集划分算法,并构造相应的多分类器融合系统。首先,特征集合被划分成若干特征子集;然后,每个特征子集由一个子分类器分类识别;最终,多个子分类器的分类结果融合输出。特征子集所包含的维数降低,子分类器的维数灾减轻。选用合理的特征子集划分算法保证子分类器的正确性和多样性,融合多个子分类器的分类结果就能够得到更好的分类性能。本文构造了基于遗传算法的特征子集划分算法和基于互信息的特征子集划分算法。遗传算法根据多分类器的融合正确率,采用全局搜索机制寻找最优的特征子集划分,属于Wrapper类的特征子集划分算法,该算法能够为子分类器选取最适合的特征子集。互信息根据特征与类的相关性,通过前向贪心搜索机制为子分类器选取相应的特征子集,属于Filter类的特征子集划分算法,该算法具有时间复杂度小的优点。本文提出了一种模糊最近邻分类器,并采用它为子分类器。最近邻分类器仅能够给出数据所属的类别信息;而模糊最近邻分类器能够给出数据在每一类中的隶属度,更有效的反映输出结果。多个子分类器的决策通过模糊积分融合得到最终分类结果。模糊积分是基于模糊测度的融合算法。模糊测度用于度量子分类器的重要性,重要性根据训练数据学习得到。与其他融合算法相比,模糊积分不仅考虑了子分类器的实际输出,而且考虑了子分类器的重要性,融合效果好。实验表明,基于遗传算法和基于互信息划分特征子集的两种模糊最近邻融合算法的分类性能均优于最近邻分类器的分类性能。本文将上述3种算法应用于识别Corel图像库。Corel图像库中每幅图片分别通过颜色直方图,颜色一致向量,PWT和Hu矩提取得到4个特征文件,作为图像识别实验系统的输入数据。加权模糊C均值算法图像聚类的结果优于模糊C均值算法。图像分类采用基于遗传算法划分特征子集的模糊最近邻融合算法和基于互信息划分特征子集的模糊最近邻融合算法。两种融合算法分类图像的结果明显优于最近邻分类器。由于两种特征子集划分算法采用了不同的策略,融合算法的分类性能依赖于不同的数据库有所不同。
其他文献
在变换域方面,提出了两种基于Q-Shif双树复数小波变换(Q-Shif DT-CWT)的融合算法。针对低频系数和高频系数的不同特点,算法一分别采用邻域梯度取大(NGMS)和模值取大(MVMS)融
目的回顾分析近6年广州血液中心临床供血量,掌握广州市临床供血整体水平,预测供血趋势,促进医院合理、科学使用血液提供资料。方法收集2012—2017年广州血液中心临床供血资料
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
受虚拟现实技术飞速发展的驱动和客观应用需求的牵引,虚拟人技术逐渐成为虚拟现实技术的一个重要分支,已经越来越受到人们的重视。对这一前沿性问题的研究已形成新的研究热点
近年来,基于内容的图像检索(Content-Based Image Retrieval,CBIR)技术获得了蓬勃的发展。当前,该研究领域所面临的主要困难在于,大多数现存的基于内容的图像检索系统是通过对不
我国医疗损害鉴定制度的不完善一直是困扰立法者、司法者与鉴定人员的难题.《侵权责任法》实施后,“双轨制”的鉴定制度有一定程度的改进,但仍然没有实质性的改变.本文旨在通
在二语习得研究中,意识的使用与否常被认为是导致习得者言语表现改变的一个重要因素,因此使用有效手段来测量意识,对提高研究的内部信度意义重大。本文运用Levelt的一语输出
纹理在计算机视觉和真实感绘制技术中具有十分重要的作用。其中为了解决纹理映射存在的走样问题而提出的纹理合成技术应用范围更为广泛。在纹理合成研究领域,合成速度与合成
目的研究马来酸依那普利叶酸片治疗老年慢性心力衰竭的疗效。方法研究对象为2016年11月至2017年11月我院收治的老年慢性心力衰竭患者60例,采用抽签分组法进行分组,患者根据抽
近二十年来,随着三维数据采样设备的长足进步与复杂拓扑结构的曲面造型日益普及,细分曲面已成为计算机辅助几何设计(CAGD)和计算机图形学(CG)领域内的一个国际性研究热点。然而