论文部分内容阅读
随着宽带移动通信技术的发展以及IOS、Android等移动智能及智能应用的出现,曾经局限于实验室的增强现实(Augmented Reality, AR)技术开始走进大众视野,一大批以终端定位、图像识别为技术特征的移动互联网增强现实应用开始涌现,称为移动增强现实应用,这引起了业界较大关注,成为技术研究热点。美国《时代》杂志在2010年将移动增强现实及应用列为引领未来的十大科技趋势之一。移动增强现实将虚拟的增强现实信息应用到真实世界,改变了用户观察周围世界的方式。传统的基于文本输入的WEB页面浏览查询模式,将转变为基于加载在移动智能终端的多种传感器进行热点捕获,将热点的增强信息叠加在真实场景上的下一代信息展现模式,极大提升了用户体验。本文结合国家科技重大专项课题,研究移动增强现实中的图像处理关键技术,同时研发一套可商用的移动增强现实应用系统,为移动增强现实应用的产业化进行大胆探索和实践。本文研究的移动增强现实中的视频和图像处理关键技术,主要包括视觉搜索、目标的注册与跟踪、移动增强现实内容展现以及相关的图像压缩等多个方面,通过这些关键技术的研究,针对移动增强现实应用场景,针对性地提出了一些创新性的解决方案,分别解决了移动增强现实应用中图像搜索、图像识别、图像渲染等不同环节中存在的一些问题。主要研究内容简介如下:1.视觉搜索技术针对现有移动增强现实中的视觉搜索技术查询精度不高、码流不能自适应等问题,提出了一套完整的内存占用小、不同码率特征搜索鲁棒性强、易于分布式部署的移动视觉搜索解决方案。通过基于统计方法的融合多种影响图像检索性能的特征点选择方法、简单的描述子线性变换方法、以及基于区块的位置点编码方法,有效降低了局部特征码流;通过使用基于Fisher向量的局部描述子聚合方法,有效聚合局部特征并去除干扰信息,生成可快速进行距离计算的二进制紧凑型描述子,并采用DISTRACT算法来进行几何校验,对检索结果进行二次过滤,使得整套系统性能在不同码率的特征码流中表现均比较稳定,并结合快速线性查找方法实现了快速的视觉搜索,为移动增强现实系统的大规模部署提供了有力的条件。2.注册跟踪技术主要通过将特征匹配识别与特征跟踪分为多线程并行计算,以及对传统RANSAC算法进行几何约束优化,有效解决了现有基于无标识注册跟踪的增强现实系统中的实时性问题。另一方面,通过在系统中加入特征跟踪质量评估来实现两个线程间状态的切换,以及对单应矩阵进行有效性筛选等方法,使得系统在保证流畅性的同时,对目标旋转、平移、缩放和部分遮挡情况下均可进行稳定跟踪。最后实现了一套可在移动终端侧实时稳定跟踪的增强现实跟踪注册系统。3.内容渲染技术以轻量高效为主要目标对移动增强现实内容展现关键技术中涉及到的脚本解析、内容加载和渲染方案进行选型,依据大量测试结果对不同格式的增强内容给出了相关配置建议,同时针对目前由于移动智能终端计算资源有限尚无法运行于移动增强现实应用中的景深、阴影的渲染算法进行了探索,在阴影渲染时利用哈希表的方法快速查找轮廓边,同时基于Per-Object的思想进行阴影体构建,大幅减少了渲染的面元数目;在景深渲染时模拟了真实成像过程中各像素弥散圈的形成并混合生成景深图像的过程的景深渲染方法,在基于单层图像的基础上还原扩散的过程,利用高斯滤波实现了模糊边缘的平滑过渡,并且在实现过程中利用GPU的异构编程方法对代码进行加速,使算法在PC平台上性能获得了数倍提升,为未来应用于移动智能终端提供了可能。4.图像压缩技术在标准JPEG编码框架下:一是实现了一种视觉无损图像压缩算法,其中首次引入有效且完备的图像质量评价方法,动态调整质量因子,在保证用户视觉无感知的情况下,获得了较高压缩比;综合考虑压缩前后图像的信噪比、边缘和纹理等因素,构建客观图像质量评价模型,并利用质量因子及客观图像质量评分的先验统计知识,大幅缩小需调整的质量因子动态范围,并采用二分法快速调整质量因子,有效提高了系统运行效率。二是实现了一种特征无损图像压缩算法,其中基于用户图像拍摄习惯是图像特征分布的特点,对DCT系数进行调整,在保证图像特征信息无损失的情况下,比原始JPEG图像占用空间减少了42.7%;同时用遗传算法训练海量数据,获得特征无损量化表,有效回避量化表解空间过大问题,提高了系统运行效率。在此基础之上,将理论研究成果应用于工程实践中,完成了移动增强现实业务系统架构设计,组织开发了增强现实业务应用平台和移动智能终端侧增强现实客户端应用软件,完成了一次有意义的移动互联网增值业务和信息服务创新模式的实践,为增强现实业务的推广普及奠定了基础。