【摘 要】
:
随着深度学习技术的不断进步与发展,智能语音交互技术在各种产品、领域中表现出积极的重要价值。在整个语音交互系统中,最重要也是最困难的就是语音识别。近年来越来越多的学者开始运用深度学习技术对中文语音做特征识别研究,然而,中文语音丰富而复杂,一音多词,孤立词,个性化热词等这都给中文语音识别增加了复杂度。大部分学者研究语音识别是基于单独孤立词研究和标准连续语音识别研究,对于一些区域性非限制表达方式识别性能
论文部分内容阅读
随着深度学习技术的不断进步与发展,智能语音交互技术在各种产品、领域中表现出积极的重要价值。在整个语音交互系统中,最重要也是最困难的就是语音识别。近年来越来越多的学者开始运用深度学习技术对中文语音做特征识别研究,然而,中文语音丰富而复杂,一音多词,孤立词,个性化热词等这都给中文语音识别增加了复杂度。大部分学者研究语音识别是基于单独孤立词研究和标准连续语音识别研究,对于一些区域性非限制表达方式识别性能较差。针对上述问题,本文对基于CNN的语音识别算法进行了研究,同时结合科大讯飞的AIUI开放平台,设计开发出一款语音交互系统。针对语音交互的高效、准确性要求,根据卷积神经网络的特征提取能力强、运行效率高等特点,本文提出一种基于CNN网络结构的声学模型,通过设计多层卷积层对应一层池化层使得模型结构可以看到足够多的历史信息。首先通过加窗分帧、傅里叶变换操作将语音信号序列转换为频域图像,即语谱图;将语谱图送入设计后的深度卷积神经网络中进一步特征学习,接着将特征序列输入全连接层进行特征整合,最终通过CTC损失函数优化输出序列。传统语言模型主要是基于规则模型和统计模型,通常它们只假设词与自己前面两个词的相关性,而忽略前面所有词的影响。根据Self-Attention无视词之间的距离直接计算依赖关系的特点,本文提出一种基于自注意力机制的语言模型,它可以学习一个句子的内部结构,可以学习当前单词和句子前一部分词之间的相关性。首先构建音素与文本的映射,将对应序列送入多头注意力函数进行加权求和得到attention函数,接着通过全连接层进行学习整合输出。本文基于课题中训练好的语音识别模型,结合科大讯飞的语义理解和语音合成功能,在Window平台VS2017+QT环境设计开发出语音交互系统。首先设计整体程序框架,主要分为算法层,逻辑交互层,GUI层。功能上实现麦克风语音拾取、扬声器语音播放,本文语音识别模型的调用,讯飞语音SDK和AIUI平台的应用。
其他文献
始终如一地把人才当作发展的第一生产力,始终如一地尊重人才的首创精神,始终如一地容忍人才的"暴脾气",始终如一地为人才创造良好环境。在中央人才工作会议上,习近平总书记强调:"要坚持党管人才,坚持面向世界科技前沿、面向经济主战场、面向国家重大需求、面向人民生命健康,深入实施新时代人才强国战略,全方位培养、引进、用好人才,加快建设世界重要人才中心和创新高地。"
近日,中共中央政治局就加强国防和军队现代化建设举行第二十二次集体学习。中共中央总书记习近平主持学习并讲话。习近平强调,党的十九大以来,党中央和中央军委就国防和军队现代化作了新的战略筹划和安排。要坚持政治建军、改革强军、科技强军、人才强军、依法治军,全面推进军事理论、军队组织形态、军事人员、武器装备现代化,
在人民军队建设发展的历史过程中,政治工作作为人民军队的生命线,是军队工作的重中之重。刘亚楼从成为人民空军首任司令员开始,在指导空军建设的十六年时间中,形成了别创一格的政治工作理路,为空军政治工作的发展提供创造性指导。研究刘亚楼人民空军政治工作理路,对当今人民军队思想政治建设具有重要的借鉴意义。
“双减”政策彰显科教兴国战略目标,聚焦立德树人根本任务,规制教育资本无序扩张。目前,“双减”背景下的课后服务难点在学生方面体现为课外补习负担能否真正减轻、多样化需求能否真正得到满足、学习力和发展力能否得到提升;在教师方面体现为工作负担有可能加重、心理负担有可能加剧、角色负担有可能加码;在提质增效方面体现为课后服务覆盖面不广、实效性不强、监管力度不大等问题。探析“双减”背景下的课后服务进路:要坚持“
随着民族文化保护与传承意识的普遍觉醒,各类民族音乐被广泛的研究。但专门针对彝族乐器的研究还不够丰富,本文采用文献分析法,以CNKI为研究对象载体,对"彝族乐器""彝族器乐""彝族乐舞""彝族音乐"有关器乐主题的文章进行文献研究,发现存在着数量不多、质量普遍不高、研究深度不够、科学性不强等问题。
茶在我国的利用已经有5000多年的历史,经历了由药用到食用再到饮用的过程。今天,茶已发展成为风靡世界的饮料,古今中外有不少名人雅士撰文赞扬茶的功效。那么,茶叶的功用到底体现在哪些方面?我们先从古人对饮茶功用的切身体会和经验总结谈起。一、古人对茶叶养生的认识
受到单体电池容量和电压的限制,电动汽车上需要将大量单体电池串并联来满足电动汽车的性能要求。在电池组中单体间的差异是必然存在的,这会导致电池组容量损失、最大输出功率下降、安全性等一系列问题。本文围绕电池组的不一致性问题,沿着不一致性的影响、识别、控制的脉络,对参数差异的影响、容量差异的估计和电池组均衡展开了研究。建立理想电池组模型分析了单体间SOC、容量、内阻不一致对电池组最大可用容量的影响。分析不