【摘 要】
:
在机器学习和模式识别领域,会不可避免地遇到很多高维数据,从而出现“维数灾难”。为了避免“维数灾难”问题,需要对高维数据进行特征降维。特征降维是指通过线性或者非线性
论文部分内容阅读
在机器学习和模式识别领域,会不可避免地遇到很多高维数据,从而出现“维数灾难”。为了避免“维数灾难”问题,需要对高维数据进行特征降维。特征降维是指通过线性或者非线性映射把高维数据投影到一个低维的空间,同时揭示隐藏在数据中的内在结构信息。本文主要研究基于无监督和半监督的特征降维算法。首先,在无监督降维方面,高斯过程隐变量模型是一种有效的方法。它提供了一个从低维隐变量空间到高维观测数据空间的光滑映射。这种光滑映射就可以使得在隐空间中相距较近的样本点,经过映射到观测数据空间后,依然相距较近。然而,它并不能保证在数据空间相距较近的样本点经该映射降维到隐空间后依然相距较近。为了解决高斯过程隐变量模型的这一不足,提出了一种基于局部保持的隐变量模型算法。该算法能使得在数据空间相距较近的样本点经过降维后,在隐空间中依然相距较近。在几类数据库上进行的测试结果表明了该算法的有效性。其次,在半监督降维方面,除了可以知道样本的类标信息,还有另外一种监督信息,即成对约束信息。成对约束是指两个样本要么属于同一类,要么不属于同一类。但是目前利用成对约束进行降维的算法只是简单的利用约束关系,并没有挖掘成对约束关系中的本质特性,比如传递性和排斥性。因此,提出了两种半监督降维算法:一种是基于整体保持的半监督降维算法,该算法不仅利用了约束关系的传递性和排斥性,而且还保持数据集所在低维流形的整体结构;另一种是基于局部保持的半监督降维算法,该算法除了利用了成对约束的传递性和排斥性外,还可以保持数据集所在低维流形的局部结构。在几类数据库上实验表明,该算法要优于其他的降维算法。
其他文献
在对自贡市中小学2000余名教师进行了关于教育科研现状的问卷调查和访谈后,发现自贡市教育科研存在教育科研意识不强,经费投入不足,发展不平衡,研究能力弱,科研效果差、成果
作为使命驱动型组织,博物馆在时间和空间维度上集中展示地方意识,它是更注重精神层面需求的文化旅游者的必访地。文化旅游者的博物馆旅游体验质量在很大程度上取决于其先验性
目的探讨颅脑损伤老年患者头颅CT图像计分与血清中白细胞介素-12(IL-12)和C反应蛋白(CRP)表达的关系。方法收集98例颅脑损伤的老年患者,在伤后36 h内行头颅CT扫描,同时检测血
为了深入研究天体引潮力与地震的关系,在以前研究的基础上,采用分区研究的方法,分析了1900.0~2000.0全球发生的M≥7.0的地震与月亮升交点黄经的关系,从而揭示了月亮交点潮可
<正> 随大军进城我们粤赣湘边区纵队教导营是在十月二十几号到达广州的,距离解放大军先头部队入城时间,差不多有一个星期,那是因为在战争的日子里,交通梗阻,我们又僻处东江乡
资本结构理论是金融理论研究的重要内容,关于是否存在最优资本结构、公司如何选择资本结构的问题,一直是学术界研究的热点。继Myers和Majluf提出优序融资理论之后,国内外学者
不同的幼儿园教育质量概念界定背后,往往显示了质量观的差异。传统质量观从管理学和经济学视角出发,更为关心"目标达成"和"满足需求",遵循的是"管理的逻辑"和"市场的逻辑"。
丹皮酚主要通过杀伤肿瘤细胞、诱导凋亡,影响肿瘤血管生成,促进IL-2及TNF-α生成,下调COX-2表达发挥抗肿瘤作用;但我们研究证实丹皮酚对体外神经胶质瘤U251细胞及肝癌HepG2细
目的:探讨腰椎间盘突出症的核心病机为“络脉痹阻”。方法:采用中西医结合方法,以通络止痛为治法,运用活络效灵丹合当归四逆汤化裁,辨证与辨病相结合,同时以现代解剖学和病理
1937年,抗战全面爆发,南京、武汉相继沦陷。国民政府于同年11月20日发布《国民政府移驻重庆宣言》。国民政府教育部及各大国家机构陆续迁驻至渝,重庆一跃成为全国的政治、经