论文部分内容阅读
微创手术是目前十分普遍的外科手术形式,它将手术器械和内窥镜通过体表上的微创孔送入人体,对人体内腔器官实施手术,其关键技术之一是内窥镜的稳定定位和对焦。传统的人工手持方式虽然在操作灵活性方面具有优势,但人工操作难以长时间维持某一固定姿势,从而导致图像抖动和模糊,影响医生正常诊断和治疗。内窥镜自动定位装置解决了以上问题。但传统的操作模式会增加医生的负担,影响手术效率。本文在自动定位装置的基础上,提出了智能化的语音识别控制方式。医生通过语音口令控制内窥镜的移动和定位,操作方式上更加方便快捷。根据系统实际应用环境,完成了语音自动控制系统的整体方案设计,研究了基于动态时间规整(DTW)的语音识别算法,并提出了归一化平均动态时间规整算法(NA-DTW)。与传统算法相比,系统识别率和计算速度都得到了提高和改善。以片上Windows CE操作系统和ARM为软硬件平台,实现了基于嵌入式的机器手语音自动控制功能。论文主要工作:研究分析国内外常用的语音识别算法,对不同算法的性能进行总结,根据内窥镜自动定位系统对语音识别算法的要求,完成语音识别系统方案设计,选择基于动态时间规整(DTW)的语音识别算法作为核心算法;对语音识别算法流程中的预处理、端点检测、特征参数提取、模式识别等模块进行深入研究。针对传统DTW存在的缺点,提出了改进的归一化平均动态时间规整算法(NA-DTW),使算法在识别率和运算速度上都获得了较大改善;以片上Windows CE操作系统和ARM(S3C2440)为软硬件平台,实现算法的嵌入式移植。通过Embedded Visual C++(EVC++)编译软件完成语音识别控制中应用程序、控制程序和用户操作界面的C语音程序编写。完成语音识别模块的嵌入式软件开发;完成识别算法的MATLAB仿真实验,验证了NA-DTW算法与传统DTW算法相比,识别率从96.6%提高到99.76%,运算时间从469ms缩短到241ms。完成嵌入式系统整体功能验证,测试了语音识别系统中端点检测和语音识别的实际效果,验证系统在嵌入式硬件中运行的有效性和可靠性。