论文部分内容阅读
视线估计一直以来都是科学家们研究的前沿课题,在人机交互、智能机器、临床医学等领域有着广泛的应用前景。非侵入式视线估计技术能够兼顾精度和舒适性,减少使用者对机器的排斥心理,是最适合实际应用的视线估计方法,因此近年来得到了广泛的重视,取得了较快的发展。非侵入式视线估计作为一个极具应用价值的课题,涉及计算机视觉、模式识别、图形学、认知科学等多个学科,集合了人脸检测、人眼定位、轮廓特征提取、三维重构等多种技术。
本文在总结国内外科研成果的基础上,对视线估计中涉及的人脸光照补偿、人眼检测和轮廓特征提取等关键技术进行了研究,并提出一套包括虹膜定位、特征提取,初步估计和误差校正等步骤的视线估计算法。该算法在单相机、无特殊光源、无头部约束的情况下,突破了图像分辨率的限制,提高了视线估计精度。
本论文的主要创新点总结如下:
1.针对非侵入视线估计系统中人脸、人眼检测易受到光照影响的问题,提出一种基于方向扫描的光照补偿方法。首先利用标准光照下平均脸的先验统计信息构建标准光照模型;然后对非均匀光照下人脸图像进行光照方向估计,并沿垂直光照方向对图像灰度进行统计分析;最后利用标准光照模型,沿光照方向逐线对人脸进行线性和非线性的复合补偿,把非均匀光照人脸调整到标准光照状态。在Yale B人脸库上的处理结果表明,该算法对大角度斜光照和极度暗光照情况都有很好的补偿效果,在处理效果和计算速度上都优于AT算法和Wavelet算法,有助于提高复杂照明条件下人眼定位、分割的精度。
2.提出一种基于稀疏表示理论的人眼检测方法。首先采用K-SVD算法对所有含有边缘信息的图像块进行学习,生成过完备字典。然后根据稀疏表达理论划分眼睛字典和背景字典。通过比较利用两个字典重建图像的误差,实现对图像块的分类,进而确定人眼区域。实验表明,即便在没有预先定位人脸的情况下,通过设定适当的阈值,该算法能准确地从彩色图像中检测到人眼,并且对复杂背景、环境光照、测试者姿态和表情都有较好的鲁棒性。
3.针对虹膜轮廓检测中遇到的问题,对已有的RANSAC方法进行改进,提出一种稳定、有效、易用的虹膜边缘提取和轮廓拟合算法。结合Canny算子、Sobel算子和二值图像形态学算子,排除眼睑和睫毛的干扰,准确提取虹膜边缘。分析了RANSAC方法拟合虹膜轮廓失败的原因,为了获得更加稳定和准确的虹膜轮廓拟合结果,提出修改随机点分布策略,并用虹膜直径作为拟合椭圆长短轴的约束条件。实验结果证明,该方法在没有增加计算复杂度的前提下,有效降低了噪音点和孤立点对拟合结果的影响。
4.提出了一种在单相机、无特殊光源和头部校正设备条件下的视线估计算法。建立了定焦相机下处理视线估计问题的坐标系统的数学模型,推导了视线方向和虹膜轮廓形变之间的关系,并通过查表可以快速得到视线方向的初步估计,避免了复杂的三维空间中曲线方程求解的问题。在实验过程中发现了虹膜中心位移和瞳孔中心位移的规律,利用这一规律巧妙地解决了视线方向估计的歧义解问题,并通过分析眼睛的生理机构,合理解释了这一规律的原因。引入了描述眼球运动的平动向量和转动向量,并将其作为误差修正的特征值,利用神经网络方法对误差进行了修正。在自采图像库上的多个实验表明,该方法突破了图像分辨率的限制,将基于虹膜形变的视线估计方法的误差降低了至少36%,显著的提高了视线估计精度。