基于自然语言处理的语音识别后文本处理

被引量 : 12次 | 上传用户:mengxiangpiaoxue
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前对语音识别后处理的研究正呈现出多样化,语言学知识在研究过程中越来越受到重视,应该更加深入地应用语言学知识,应用自然语言理解方面的各种现有及正在兴起的方法来改善语音识别系统的性能。本课题以此为指导,主要针对“奥运多语言综合信息服务”项目的典型示范系统“CityGuide”,研究语音识别后语句检错纠错方法。将采用基于自然语言理解方法,即主要从语法、语义和语用三个方面出发,重点关注语用信息对识别正确率提高的贡献。本文的主要研究工作和成果有:1,在智能移动终端的语音识别引擎之后引入基于自然语言理解模块,特别需要指出的是,在原有算法(包括语法、语义算法)基础上增加了语用算法和一些辅助算法,使语音识别的正确率约从52%提高到70%。2,目前该演示系统已完成在智能手机上的实验性设计、实现与测试,并尝试引入智能移动平台的语音引擎,实现语音识别及识别后利用自然语言理解方法来进行纠错。目前系统主要支持单句语音输入,所支持语种为中文/英文两种语言。3,提出了一种基于元搜索技术的在线语料知识库采集、学习、构建和更新优化方案,特别针对语言本身存在一定的模糊性和不确定性的特点,探讨了模糊理论在文本分类中的应用,提出了一种梯形隶属度函数法将分类结果模糊化,以及引入模糊熵的概念来评估文本模糊化分类的性能,克服了原有实验系统语料库规模小、领域局限性大、来源不够丰富、缺乏时效性的缺点。
其他文献
随着社会主义市场经济的快速发展和经济全球化进程的不断深入,旅游业已经成为当今世界发展速度最快的产业,对促进区域经济发展方面起着非常重要的作用。鄂州是一座历史文化名
县域经济是全面建设小康社会的最薄弱环节,日益受到人们的关注和经济学界的重视。河南省县域经济发展比较滞后、经济总量和人口都占较大比例的区域经济,很大程度上影响全面建
Orexin除了主要分布于中枢神经系统的下丘脑外,还广泛分布于包括外周的胃肠组织,如胃肠神经丛和内分泌细胞等部位。Orexin在促进食欲的同时,还能通过中枢和外周途径调节胃肠
针对基于高轨卫星的对非合作低轨卫星的无源定轨问题,论文分析并实现了两种定轨方法,即仅使用角度信息的方法和基于角度和频率信息的方法,并实现了针对此问题的定轨仿真环境
大量研究表明,脑卒中能刺激细胞增殖和神经发生,神经干细胞能增殖、迁移、分化为新生神经细胞。在脑卒中后的神经发生过程中,基因调控和各类外来信号分子发挥着重要的调节作
中国城市空间重构表现为均质的城市空间向异质的多元的城市空间转变。单位转型是城市空间重构的缩影和重要组成部分。一方面,单位的空间和社区特点对于构建单位退休者社区和
<正>综观改革开放与社会主义法治国家建设互动的历程,我们深深感到,在社会主义法治国家建设中,深化改革是根本动力,扩大开放是必要条件,开拓进取是时代接力。深化改革是社会
甘丙肽存在于外周和中枢神经系统。它以其广泛的抑制功能参与调节胃肠、泌尿生殖系统平滑肌收缩,胰岛素、垂体激素的分泌而实现它作为神经调制物在外周和中枢的作用。它协同吗
《2001年世界卫生报告》表明,世界有4.5亿人患有各种类型的精神和脑部疾患。另外,每4个人当中就有1个人在其生命过程的某个时间段产生某种精神障碍。在我国,据2010年残联的数
当今时代,企业财务管理已经成为影响企业发展的重要因素。而在改革开放不断深化的今天,各种社会矛盾日益突出,企业怎样履行社会责任的问题已经成为影响社会和谐的重要原因。