机器手语音识别控制的研究与实现

被引量 : 0次 | 上传用户:LEAMI
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微创手术是目前十分普遍的外科手术形式,它将手术器械和内窥镜通过体表上的微创孔送入人体,对人体内腔器官实施手术,其关键技术之一是内窥镜的稳定定位和对焦。传统的人工手持方式虽然在操作灵活性方面具有优势,但人工操作难以长时间维持某一固定姿势,从而导致图像抖动和模糊,影响医生正常诊断和治疗。内窥镜自动定位装置解决了以上问题。但传统的操作模式会增加医生的负担,影响手术效率。本文在自动定位装置的基础上,提出了智能化的语音识别控制方式。医生通过语音口令控制内窥镜的移动和定位,操作方式上更加方便快捷。根据系统实际应用环境,完成了语音自动控制系统的整体方案设计,研究了基于动态时间规整(DTW)的语音识别算法,并提出了归一化平均动态时间规整算法(NA-DTW)。与传统算法相比,系统识别率和计算速度都得到了提高和改善。以片上Windows CE操作系统和ARM为软硬件平台,实现了基于嵌入式的机器手语音自动控制功能。论文主要工作:研究分析国内外常用的语音识别算法,对不同算法的性能进行总结,根据内窥镜自动定位系统对语音识别算法的要求,完成语音识别系统方案设计,选择基于动态时间规整(DTW)的语音识别算法作为核心算法;对语音识别算法流程中的预处理、端点检测、特征参数提取、模式识别等模块进行深入研究。针对传统DTW存在的缺点,提出了改进的归一化平均动态时间规整算法(NA-DTW),使算法在识别率和运算速度上都获得了较大改善;以片上Windows CE操作系统和ARM(S3C2440)为软硬件平台,实现算法的嵌入式移植。通过Embedded Visual C++(EVC++)编译软件完成语音识别控制中应用程序、控制程序和用户操作界面的C语音程序编写。完成语音识别模块的嵌入式软件开发;完成识别算法的MATLAB仿真实验,验证了NA-DTW算法与传统DTW算法相比,识别率从96.6%提高到99.76%,运算时间从469ms缩短到241ms。完成嵌入式系统整体功能验证,测试了语音识别系统中端点检测和语音识别的实际效果,验证系统在嵌入式硬件中运行的有效性和可靠性。
其他文献
随着冠心病发病率逐年增高,目前经皮冠脉介入术已成为有效的治疗手段。其中冠状动脉分叉病变的介入策略相关研究倾向于单支架-即兴支架术,而在单支架策略边支保护过程中,因边
本文对碳纳米管、稀土/碳纳米管、稀土/碳纳米管/钡铁氧体以及碳纳米管/羰基铁粉复合吸波剂的复介电常数和复磁导率进行了测定。应用传输线法计算了复合吸波剂的吸波反射率。
<正>"老师,××吃零食。""×××骂人。"一到课间,总有一些同学跑到老师那儿去打小报告。你有没有向老师打过小报告呢?有没有被小报告"举报"过呢?今天,咱们走进莲溪学校六年
期刊
Caco-2小肠上皮细胞模型被广泛应用于研究食品营养物质成分的转运及吸收机制,基于Caco-2 小肠上皮细胞模型,不仅可以评价食品营养物质的生物利用度,还可以了解其他因素对食品
近年来随着我国经济的发展,电子、医药、化工等工业对空调洁净度的要求越来越高。但我国的洁净厂房的建设还处于起步阶段,现有的洁净厂房受资金、技术的影响还存在着很多问题
饲料的安全卫生直接关系到饲喂动物的安全和健康,间接影响到人类的生活和健康。目前,我国的饲料安全问题不甚乐观,饲料安全事件如"瘦肉精"事件、"苏丹红"事件等仍有发生,在国外出
三唑类化合物具有高效、广谱杀菌活性,同时也具有止痛消炎、抗血压、抗肿瘤、植物生长调节以及舒张血管等活性,已引起了各国化学家的高度重视,掀起了一股三唑类化合物的研究
为了满足不断多样化的建筑使用功能及结构形式,各式各样的转换层形式都将逐渐应用于实际工程。桁架转换层受力明确,自重较轻,并且有利于管道的灵活布置。当转换跨度较大且支承上
<正>心力衰竭(心衰)是各种心脏疾病的最终结局。过去20多年,随着心脏康复的蓬勃发展,心衰康复治疗也得到快速的发展,告别了"绝对卧床"的时代。现代心衰康复包括教育、咨询、
为更好地解决移动语音通信安全传输的问题,本课题提出了一个在用户不更换手机、不开通新业务、不对现有移动通信网络进行改造、且有较高的语音通信安全性的前提下,解决手机语