论文部分内容阅读
伴随着社会文明程度的提高,信息无障碍的研究与发展备受瞩目。其中针对聋哑人的手语识别技术研究得到了社会越来越多的关注。手语作为聋哑人之间最基本的交流方式,为社会上的弱势群体如聋人和正常人之间的交流和沟通提供了一个很好的平台,让他们能够像正常人一样得到整个社会方便快捷的服务,因此作为手语中关键的手语识别技术和合成的技术显得尤为重要,而且手语技术的发展也是今后社会文明程度进一步提高的关键。本文详细地介绍了手语合成的发展历程和研究现状,并在视频拼接的手语合成基础上,通过数据手套等数据采集设备,深入探讨了人体建模和人体关键点的运动跟踪的常用算法。通过对手语视频合成中的过渡帧的构建来提高手语合成的真实度,综合比较了常见人体运动跟踪的优缺点及存在的改进方法。并重点研究了粒子滤波算法及其存在的局限性,在分析其本身及研究目前现有的目标跟踪算法的基础上,提出了光流相结合的粒子滤波算法,对手语视频合成中人体关节点的目标跟踪与识别提供了数据基础。在3ds Max和VC++6.0搭建的实验平台下,通过插件的方式实现了本文提出的改进算法。在普通PC机相同的条件下,分别用传统粒子滤波算法和本文的改进算法进行实验,经过对比,利用光流驱动的粒子滤波算法比传统粒子滤波方法跟踪手语视频中的腕部位置不会因为手部移动速度过快而出现了明显的跟踪错误,保证了目标跟踪的准确性,实验论证了本文提出的改进算法的实用价值。最后,对人体关键点的跟踪结果进行了分析,通过本文提出的过渡帧判断机制和融合机制进行了最后一步的手语合成,实验验证,基于过渡视频库拼接的手语合成其合成效果高于直接拼接。