论文部分内容阅读
视线跟踪技术是近年来在多媒体以及人机交互领域内的热门研究课题,它可以通过捕获人眼的运动轨迹来获取人眼的视线方向或注视点的位置。由于其直接性、灵活性和自然性等特点,在计算机控制、密码输入、广告测评、医学诊断及虚拟现实等领域具有广泛的应用前景。然而,尽管视线跟踪技术的应用存在着诱人的前景并且近年来也取得了较快的发展,但由于各方面技术的不成熟、人眼运动本身的特性以及过高的成本,使得目前的视线跟踪技术尚不能广泛应用于实际生产,仍然有许多问题需要解决:进一步提高视线跟踪系统的精度及鲁棒性;提高系统的自由度,降低对用户头动的限制以及定标过程的复杂度;降低算法的复杂度以保证系统的实时性;降低系统的成本。针对上述问题,本文以基于近红外光源的非接触式视线跟踪系统为研究平台,分别对图像预处理、注视点估计以及系统定标等环节进行了深入研究并提出自己新的思想和算法,以便进一步提高现有视线跟踪系统的精度、自由度,降低系统的成本,推动视线跟踪系统实用化的进程。论文的主要创新性研究如下:1、提出基于灰度差的视线跟踪预处理方法,利用人脸、角膜反射点以及瞳孔之间的灰度差来定位人眼,并针对瞳孔及反射点本身在形状、面积、空间位置上的特点,通过腐蚀膨胀、桥接、筛选等图像处理手段消除眼镜、配饰等外界干扰因素对人眼定位的影响,以进一步提高视线跟踪系统的精度及鲁棒性。2、将超分辨技术应用于视线跟踪系统,对拍摄图像的局部区域,如提取出的大致瞳孔区域,使用超分辨技术,获得具有较高分辨率的图像,以便更为精确地提取人眼特征参数,进而提高视线估计结果的精度。3、提出一种基于空间相似三角形的双光源注视点估计算法,利用人眼图像中瞳孔中心与两反射点构成的三角形和屏幕上注视点及两个红外光源构成的三角形为近似相似三角形来确定屏幕上注视点的大致位置。4、在上述基于空间相似三角形的双光源视线估计算法的基础上,对算法中产生的误差进行在三维空间中的定量分析,并得出误差的区域特性,为系统的标定和进一步提高视线估计结果的精度提供理论依据。5、提出基于二次定标的视线跟踪系统标定方法,根据估计误差的区域特性,屏幕被分为五个区域并将定标点分两次使用,不同区域的注视点利用不同定标点来定标,得到较为精确的注视点估计结果。6、根据误差产生的原理,通过利用人眼在三维空间中的位置关系,对注视点估计的结果进行较为精确地误差补偿,进一步提高视线跟踪系统的精度及自由度。7、提出一些视线跟踪技术的潜在应用,进一步扩展视线跟踪技术的应用范围。