基于流形学习理论的空间信息源研究及应用

来源 :中国科学院计算技术研究所 | 被引量 : 4次 | 上传用户:mnbin000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代计算机应用需要处理越来越多的高维数据,如何对高维数据进行有效的维数压缩,成为一个急待解决的问题,流形学习是一种流行的降维方法,它通过保持高维数据的拓扑结构完成降维任务。局部线性嵌入方法是一种应用广泛的流形学习方法,本文提出算法的一种改进,并将其应用于空间数据索引。 本文介绍流形学习方法和其已有应用,讨论其中有代表意义的一种方法—局部线性嵌入算法。在实际应用中,我们发现大多数需要处理的高维数据样本通常是稀疏的,且数值实验结果表明,局部线性嵌入算法在源数据稀疏时失效。通过分析局部线性嵌入算法的局部线性假设,以及算法实现过程中保持局部近邻性质的手段,我们发现算法的实现过程和算法的理论基础之间存在差异。局部线性嵌入算法通过保持表示坐标不变保持源数据的近邻性质,且表示坐标仅由源数据空间求得,而实际上,表示坐标应由源数据和目标数据空间内的数据共同决定,局部线性嵌入算法忽略了目标空间数据在计算表示坐标时的作用,使算法求得的表示坐标和表示坐标的真实值产生偏离,且偏离度随着源数据稀疏度的增加而增大,从而在源数据样本稀疏时无法保持邻域性质,导致算法失效。 针对这一问题,我们对源数据和目标数据空间内的两个优化函数联合优化,得到一种由源数据空间和目标空间内的数据共同决定表示坐标的新方法—联合局部线性嵌入方法。它真正实现了局部线性假设的基本思想,在源数据稀疏的情况下也能保持源数据的拓扑结构,这种方法的有效性通过对人工数据和两组人脸图像的处理结果得到验证。 空间信息应用是目前最热门的研究课题之一,但由于空间数据是一种高维数、高复杂度的数据源,且常伴随大量噪音,如何有效的组织、查询空间数据是空间信息应用中的一个关键问题,空间数据索引技术是空间处理处理的一项关键技术,我们在分析和理解空间数据自身特性的基础上,把联合局部线性嵌入算法和R树机制相结合实现空间数据索引功能。
其他文献
随着Internet/Intranet技术的发展和普及,计算机化考试在许多方面将逐步取代传统的基于纸和笔的考试。探讨和研究基于计算机网络的考试,以便能客观、准确地评估学生的某种能
随着移动智能设备应用的日益广泛,以及其综合性能的显著提高,在实际应用中,我们对应用程序有了更高的要求,希望某些应用程序具有这样的能力:应用程序可以携带当前界面和相关的上下
预测在科学管理中是非常重要的环节。在决策和规划之前,对一些关键因素的发展趋势进行预测是必要的。时间序列预测是预测领域内的一个重要研究方向,时间序列预测是一种根据历
在基于角色的访问控制(Role-Based Access Control,RBAC)中,每一个用户拥有哪些权限并非直接获得,而是系统管理员首先给每个角色分配若干权限,然后再将这些角色分配给相应的用户。
在经典粗糙集中,论域上的等价关系起着至关重要的作用。但在现实中,论域上的二元关系经常不是等价的,此时经典粗糙集模型的应用受到限制,例如,由于空值的存在,无法利用属性值
当前网格技术蓬勃发展,出现了计算网格、数据网格、信息网格、服务网格等种类,随着WSRF(Web服务资源框架)网格体系结构的出现,服务网格的地位变得越来越重要。信息服务是网格系
本文对曲面造型中三角形域上的超限插值曲面问题进行了研究。构造三角形域上的超限插值曲面技术在CAD、计算机图形学、气象和勘探等各类科学研究和工程设计中有广泛的应用。
教育的发展,技术的更新,对远程教育的发展提出了新的要求,为此,论文在传统远程教学系统的基础上,基于.NET开发平台设计并实现了一种新的远程教学系统,针对远程教学中的诸多关
随着Internet规模的不断扩大,网上的各种知识也随之迅速增长。目前,人们通常采用输入关键字的方法在WWW上查找知识,而提供知识查找服务的系统一般都未能知晓用户的位置、背景、
现代的移动通信的发展至今主要走过了两代。第一代移动通信系统(1G)是模拟制式的蜂窝移动通信系统,主要提供话音服务。第二代移动通信系统(2G)是数字移动系统,能提供低速率数