论文部分内容阅读
视觉感知系统广泛应用于各种领域,并且大多数应用中需要一次性获取较大视场信息,然而由于传统的视觉系统视场角较小,不能够满足这种需求。全景成像技术解决了这一问题,它利用其特有的大视场特性可以同时捕捉到周围环境的整个场景信息,而且还能够根据人眼的视觉习惯,将其展开成柱面全景图,技术优势非常突出。鉴于传统视觉系统的局限性以及全景成像技术的优势和广泛需求性,本课题针对目前普遍应用的可编程器件FPGA展开了全景成像系统的研究工作,设计并实现了一套完整地大视场成像系统,并且此系统具备一定的通用性。课题研究的主要内容有以下几方面:1.调查和研究了国内外全景成像技术的发展及研究现状,综合分析目前普遍采用的几种系统模型,制定了一套基于图像拼接技术的全景成像系统方案。2.选用APTINA公司的彩色CMOS图像传感器MT9M034和Xilinx公司的Virtex-5系列FPGA XC5VLX110-1FFG676I搭建高清CMOS成像系统,在硬件平台上实现整个全景成像系统的功能。3.利用Virtex-5FPGA丰富的逻辑资源,完成整个系统的控制和数据处理,主要实现的功能有:(1)MT9M034的时序控制,利用I2C接口对系统前端的三个CMOS芯片同时进行寄存器的配置,实现成像系统的复位和初始化;(2)对前端输入的三路视频信号同时进行采集并做预处理;(3)通过MATLAB软件利用相位相关法检测相邻两幅图像的重合区域,并确定相对平移量,然后在FPGA内部利用检测到的平移量信息,对相邻两幅有重叠部分的图像进行配准;(4)对配准之后图像的重合部分平均分组,并采用线性加权融合算法进行融合处理,每组采取不同的权值系数来消除拼接缝隙,达到渐进渐出平滑过渡的效果;(5)LVDS输出接口时序控制,利用前端输入的数据同步信号,产生输出端大视场图像采集所需要的帧同步、行同步信号;实验结果证明,此全景成像系统将前端同时采集到的三路分辨率为720×560的视频图像通过系统硬件内部的拼接处理有效扩大到了1920×560,水平视场角也由原先的30°扩大到了80°,系统工作的最高帧频为20fps,整体功耗低于4.8W,且工作稳定、成像清晰,达到单个像素级的精确度,具有良好的大视场成像效果,有效地解决了传统视觉视场受限的问题。文章最后对整个成像系统进行了总结,指出系统的不足并提出了改进方法,对其他同类产品和系统的设计具有一定的借鉴意义。