【摘 要】
:
语言是人类之间交流信息的主要手段之一,自电脑发明以来,人们就一直致力于使电脑能够理解自然语言。语音识别技术是集声学、语音学、语言学、计算机、信息处理和人工智能等诸领
论文部分内容阅读
语言是人类之间交流信息的主要手段之一,自电脑发明以来,人们就一直致力于使电脑能够理解自然语言。语音识别技术是集声学、语音学、语言学、计算机、信息处理和人工智能等诸领域的一项综合技术,应用需求十分广阔,长期以来一直是人们研究的热点。
神经网络是在现代科学研究成果的基础上提出来的模拟人脑结构机制的一门新兴科学,它不是人脑真实的全面描述,而是这类生物神经网络的抽象、模拟和简化,其目的在于探索人脑的信息加工、存储和搜索机制,从而为人工智能和信息处理等学科的研究开辟新途径。人工神经网络就是采用物理可实现的系统来模拟人脑神经细胞的结构和功能的系统,它模拟了人类神经元活动的原理,具有自学习、联想、对比、推理和概括能力,为很好地解决语音识别这样一个复杂的模式分类问题提供了新的途径。本文对语音信号的预处理、特征提取、以及神经网络模型的建立,都进行了较深入的研究。所作的主要工作如下:
1.对国内外语音识别和神经网络技术发展状况作了较全面的总结分析,对语音识别技术的分类、语音识别系统的构成、语音信号的预处理、语音信号特征提取等关键环节的技术问题进行了深入的理论分析。
2.在深入理解传统语音识别基本原理的基础上,做了适当的改进,详细的给出了语音识别的模型和关键技术,其重要的技术是端点检测和特征提取。尤其是在传统的DTW语音模式匹配的基础上,通过对搜索宽度限制和整体路径约束等方法,使得系统能够实现快速的识别响应,有效的提高系统的识别率和响应速度。
3.针对汉语数字语音的识别问题,建立了一个神经网络模型。将对汉语数字语音的识别转化为分类问题,采用神经网络模型作为分类器,并在Matlab环境下进行了相关的仿真实验。实验结果表明,神经网络在进行元音识别的时候具有不错的识别率。
其他文献
21世纪以来,由于经济的全球化和市场国际化的加速发展趋势,企业所面临的竞争更趋激烈。以客户为中心、基于时间、面对整个供应链,成为新形势下制造业发展的基本动向。这样就必须
流媒体应用是推动未来宽带应用的主动力,但流媒体对带宽的高占用特性使其在Internet上大规模应用面临诸多困难。传统的C/S、单源组播以及CDN(Content Delivery Network)模式
如今,Web成为了网络信息的主要平台,是人们获取知识的主要来源。但是,由于Web页面的无结构性、超链接的自由无序、以及Web内容的海量性、多样性和动态变化,人们从Web上搜索真正想
曲线作为计算机辅助设计(CAGD)与计算机图形学(CG)的重点研究对象之一,其有理参数表示是几何造型和设计中最常用的一种表示形式,如常用到的有理参数Bézier曲线与B样条曲线。同
随着信息社会的发展,越来越多的信息被数字化,尤其是伴随着Internet的发展,数字化的信息呈爆炸式增长。因而在未来几年里,如何存储和管理这些数据将成为人们关注的焦点。七、
近年来,随着医疗卫生事业的发展,在临床医疗活动中的药物使用问题逐步成为公众关注的焦点。合理用药是指根据疾病种类、病人状况和药理学理论选择最佳的药物及其制剂,制定或调整给药方案,以期有效、安全、经济地防治和治愈疾病的措施。解决临床合理用药中存在的技术性问题的指导性原则就是循证医学。循证医学的主要研究方法有随机对照研究、系统评估和临床指引等几种。遗传算法是模拟生物界适者生存、自然选择等生物进化机制发展
随着科学技术和医用科技的不断发展,中药中传统的“望闻问切”四诊法也面临着技术实现的现代化。‘望’诊,尤其是其中的舌诊是中医四诊的重要内容,它通过观察舌像的变化了解
计算机软件产业发展至今已经经历了几十年的时间,在此期间,有大量的应用软件被开发应用,软件行业是一个快速发展的行业,新旧技术的交替往往带来一个大规模的软件改造过程,在
随着嵌入式系统应用的不断扩展与深入,高可靠性在嵌入式系统的发展历程中正占据越来越重要的地位,成为设计和应用的首要考虑因素。当前,嵌入式微处理器越来越多地被应用于各