论文部分内容阅读
自上世纪七十年代末八十年代初以来,计算机视觉得到了长足的发展,涌现出了不少研究的方向和领域,如图像分割、立体视觉、运动视觉分析、由图像恢复三维物体形状的方法、物体建模与识别方法以及距离图像分析方法等。这些研究领域都围绕着一个中心而展开,即如何从看似庞大的图像信号中获取最重要的那部分信息,并用这些信息帮助计算机分析、理解图像信号的含义,这些信息被称为图像特征。 本文的工作主要集中于对图像特征的研究,并通过不同的应用对其进行进一步分析。主要的工作可以分为四个方面,即退化图像的还原、视频流中物体的跟踪,人脸表情的映射,以及人脸的模拟和生成。 第三章对盲图像的还原进行了深入的探讨,并提出了名为RIBIM(Ratio Image Based Iteration Method)的算法。该算法通过对图像信息,特别是纹理特征信息的分析,针对噪声信息进行抑制,并模拟出原图像的退化算子,最后结合比例图的概念和递归求精的方法,提高了图像还原效果。 第四章对复杂场景下的物体识别与追踪作了初步的探讨,由于采用了360度的全角镜头,使得该监控装置能够几乎无盲点地进行工作,同时提出了名为TALENT(TemplAteLEarNing based Training)的方法使用聚类对样本数据进行训练并加速查找过程,而基于训练的识别、基于状态图转换的追踪也提高了监控的质量。 第五章探讨了使用比例图进行人脸表情映射的方法,首先对现有的人脸表情生成技术作了一个介绍,接着结合人脸特征信息,从而实现了对现有人脸表情映射方法的改进。该方法具有计算复杂度低、噪声抑制能力强等优秀特征。 第六章提出了一个人脸变换的系统RATES(Region based feAture Tracking and Expression Synthesis)的整体框架和实现细节。该系统通过对497张不同年龄层次、不同性别、不同脸型的人脸进行训练学习,可以自动地对新输入的人脸图像进行识别、定位、对齐,并根据用户的需求对该人脸进行变化。特别在人脸特征定位方面,该系统使用自底向上的方法,通过13个训练集的学习,能够由局部至整体地对人脸各器官及特征点进行精确定位。在进行纹理合成时使用了GPU(Graphics Processing Unit)技术进行快速合成,并根据合成源的皮肤色彩特征信息对结果进行调整,特别注重了边缘部分的过渡效果,因此达到了较为逼真的合成结果。