人眼注视方向识别的数字图像处理技术研究

来源 :南开大学 | 被引量 : 0次 | 上传用户:glad8888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视线估计一直以来都是科学家们研究的前沿课题,在人机交互、智能机器、临床医学等领域有着广泛的应用前景。非侵入式视线估计技术能够兼顾精度和舒适性,减少使用者对机器的排斥心理,是最适合实际应用的视线估计方法,因此近年来得到了广泛的重视,取得了较快的发展。非侵入式视线估计作为一个极具应用价值的课题,涉及计算机视觉、模式识别、图形学、认知科学等多个学科,集合了人脸检测、人眼定位、轮廓特征提取、三维重构等多种技术。   本文在总结国内外科研成果的基础上,对视线估计中涉及的人脸光照补偿、人眼检测和轮廓特征提取等关键技术进行了研究,并提出一套包括虹膜定位、特征提取,初步估计和误差校正等步骤的视线估计算法。该算法在单相机、无特殊光源、无头部约束的情况下,突破了图像分辨率的限制,提高了视线估计精度。   本论文的主要创新点总结如下:   1.针对非侵入视线估计系统中人脸、人眼检测易受到光照影响的问题,提出一种基于方向扫描的光照补偿方法。首先利用标准光照下平均脸的先验统计信息构建标准光照模型;然后对非均匀光照下人脸图像进行光照方向估计,并沿垂直光照方向对图像灰度进行统计分析;最后利用标准光照模型,沿光照方向逐线对人脸进行线性和非线性的复合补偿,把非均匀光照人脸调整到标准光照状态。在Yale B人脸库上的处理结果表明,该算法对大角度斜光照和极度暗光照情况都有很好的补偿效果,在处理效果和计算速度上都优于AT算法和Wavelet算法,有助于提高复杂照明条件下人眼定位、分割的精度。   2.提出一种基于稀疏表示理论的人眼检测方法。首先采用K-SVD算法对所有含有边缘信息的图像块进行学习,生成过完备字典。然后根据稀疏表达理论划分眼睛字典和背景字典。通过比较利用两个字典重建图像的误差,实现对图像块的分类,进而确定人眼区域。实验表明,即便在没有预先定位人脸的情况下,通过设定适当的阈值,该算法能准确地从彩色图像中检测到人眼,并且对复杂背景、环境光照、测试者姿态和表情都有较好的鲁棒性。   3.针对虹膜轮廓检测中遇到的问题,对已有的RANSAC方法进行改进,提出一种稳定、有效、易用的虹膜边缘提取和轮廓拟合算法。结合Canny算子、Sobel算子和二值图像形态学算子,排除眼睑和睫毛的干扰,准确提取虹膜边缘。分析了RANSAC方法拟合虹膜轮廓失败的原因,为了获得更加稳定和准确的虹膜轮廓拟合结果,提出修改随机点分布策略,并用虹膜直径作为拟合椭圆长短轴的约束条件。实验结果证明,该方法在没有增加计算复杂度的前提下,有效降低了噪音点和孤立点对拟合结果的影响。   4.提出了一种在单相机、无特殊光源和头部校正设备条件下的视线估计算法。建立了定焦相机下处理视线估计问题的坐标系统的数学模型,推导了视线方向和虹膜轮廓形变之间的关系,并通过查表可以快速得到视线方向的初步估计,避免了复杂的三维空间中曲线方程求解的问题。在实验过程中发现了虹膜中心位移和瞳孔中心位移的规律,利用这一规律巧妙地解决了视线方向估计的歧义解问题,并通过分析眼睛的生理机构,合理解释了这一规律的原因。引入了描述眼球运动的平动向量和转动向量,并将其作为误差修正的特征值,利用神经网络方法对误差进行了修正。在自采图像库上的多个实验表明,该方法突破了图像分辨率的限制,将基于虹膜形变的视线估计方法的误差降低了至少36%,显著的提高了视线估计精度。
其他文献
针对当前初中英语口语教学存在的问题,初中英语教师应当科学整合信息技术手段,借助“语音云”智能平台、多媒体营造口语交际情境、现代化电子终端等,创新初中英语口语教学的形式
微生物燃料电池(MFC)是以微生物为催化剂,将有机物中的化学能转化为电能的新型生物能源装置。它原料来源广泛、反应条件温和,且对环境没有污染的特点而具有非常广阔的应用前景。而阳极是微生物附着、有机物氧化以及电子传递的基础,是决定MFC产电的关键因素之一。因此研究和探索阳极材料的特性,分析相关的导电机制就具有了重要的学术意义和工程价值。本课题首先对聚吡咯纳米线和聚吡咯纳米线/石墨烯复合材料性能进行了研
计算全息和数字水印相结合的全息水印是一种信息隐藏新技术,由于全息图的不可撕毁性等特点,全息水印具有很强的鲁棒性,为保护图像、音频、视频等知识产权提供新的有效手段。本文
轨枕作为轨道结构的主要构件之一,承受着来自钢轨的压力,并弹性地传递于道床,起着承上启下并有效地保持轨道几何形态的重要作用。随着列车速度的提高,其振动频率也不断提高,从而加
YBCO外延地生长在倾斜的SrTiO3衬底上时,YBCO薄膜表面法向与YBCO的c轴成α角,若有激光光沿z轴方向入射YBCO表面时,z轴有激光感生热电电压产生。这种热电材料称为原子层热电材料。这种激光感生热电电压器件(LITV)具有响应快(纳秒到皮秒)、响应光谱宽(光谱范围从紫外到红外)、灵敏度高、非制冷探测、高稳定性、易集成、成本低廉的特点,有很广阔的应用前景。本文就YBCO的制备、薄膜的生长条
当前对磁流变弹性体的研究主要是集中在机械特性和力学特性,而对磁流变弹性体电学特性的研究非常少,鉴于国外个别文献中研究提出磁流变弹性体具有磁阻特性,因此,作者尝试基于
太赫兹(THz)波是指波长介于30~3000μm之间的电磁波。随着太赫兹波产生技术的发展,太赫兹波的相关应用成为公认的研究焦点。为了实现应用系统,太赫兹波器件是必不可少的组成部分
高斯过程是新近发展的一种机器学习方法,对处理复杂非线性问题具有很好的适应性。采煤工作面瓦斯涌出量与其影响因素之间存在着复杂的非线性关系,针对传统预测方法的局限性,
宽视场高分辨率成像系统应用广泛,但传统单轴光学系统在探测器确定的情况下,其视场和分辨率之间的关系是矛盾的,一些创新性成像方式和成像手段能够有效解决这一问题,因此对该类成
高分辨率高质量光学遥感图像在遥感测绘、侦察监视、公共安全监控识别和医学诊断等军、民领域均有着重要应用价值。通常,可借助提高硬件性能和图像处理的手段提高图像的分辨能力,硬件提升手段会受到工艺水平、研制难度、周期成本等研制瓶颈的制约,因此,国内外学者在图像超分辨率重构处理方面开展了大量的研究工作。从现有文献看,现有的超分重构方法已在自然图像的处理应用中取得了较理想的效果,但针对遥感图像的纹理细节增强与