基于改进卷积神经网络的语音情感识别研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:u20051026
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音情感识别技术是人工智能的重要学科分支,通常被认为是实现人机智能交互的重要方式之一,在智能对话系统、舆情监测、服务机器人等领域有着广泛的应用。近年来,随着深度学习技术的快速发展,将深度学习技术应用于语音情感识别技术是当前热门且有效的研究领域,尤其是深度学习中的卷积神经网络(Convolution Neural Network,CNN)迅速成为语音情感识别模型的研究重点之一。但是CNN模型仍然存在一些问题值得重点研究。首先,采用CNN作为识别模型的研究中通常采用语谱图作为输入特征,但是语谱图存在细节特征不明显的问题,从而导致识别率不高;其次,CNN模型会随着卷积层的加深出现特征丢失的问题,这是制约识别率进一步提高的关键。针对这些问题,本文展开了如下研究和实验。首先,针对语谱图的细节特征不明显的问题,本文设计了一种基于Log-Gabor和改进局部二值模式(Local Binary Pattern,LBP)语谱图纹理特征提取算法,此算法先采用Log-Gabor对语谱图进行五个尺度、八个方向的细节信息放大,再用改进的LBP纹理特征提取算法对每个方向和尺度的语谱图提取纹理特征,最后将提取的纹理特征重构作为最终的特征。同时,本文还将提取的特征与梅尔倒谱系数(Mel Frequency Cepstral Coefficient,MFCC)、线性预测倒谱系数(Linear Predictive Cepstral Coefficient,LPCC)进行了对比,实验结果证明此方法能有效提高情感识别率。其次,针对CNN模型在加深卷积层时出现特征丢失的问题,本文设计了多级残差卷积神经网络,此网络采用可以跨越多级卷积层的残差结构对丢失的特征进行弥补,通过弥补的原始特征信息来提升网络性能,从而提高识别率。实验结果表明,本文提出的模型在Emo DB数据集和CASIA数据集上的识别率、收敛速度、分类精度优于参考文献中的方法。最后,本文开发了基于Jetson Nano的上位机和智能服务机器人的语音情感识别系统,并将本文提出的基于Log-Gabor和改进LBP语谱图特征算法和多级残差卷积神经网络的应用到系统中。实验结果证明了本文算法的优越性和语音情感识别系统的实用性。
其他文献
十九大报告将“污染防治”列作三大攻坚战之一,揭示了我国环境治理刻不容缓。理念上,“排污者负责、第三方治理、政府监管、社会监督”的多中心治理观开始深入人心;实践中,我
语文既是小学阶段的基础课程,也是主要课程。语文教学有益于帮助学生掌握本民族的汉语言文字,培养学生正确的人生三观。在小学教学中,德育教育贯穿于整个教学活动的始终。良
氧化铟纳米材料由于其专有的性能,在光子器件、电极、高功率晶体管、气体传感器等方面具有宽阔的应用前景。将氧化铟作为基体材料并对其进行掺杂改性可提高其气敏性能。一是
资产负债管理是保险公司风险管理的重要组成部分,是防范资产负债错配风险的重要手段,是保险公司可持续经营的基础,其基础理论是免疫理论,为保险公司提供资产和负债的期限、现
十九大报告指出,新时代中国的一切发展都是高质量的发展,要告别数量扩张型的发展。中宣部印发的《图书出版单位社会效益评价考核试行办法》,特别要求出版单位把社会效益放在
高架桥是城市重要的交通基础设施,在城市更新背景下,现代城市发展发生了从增量到存量的结构性变化。在公共空间极具缺乏的今天,城市中大量现存的失落空间的再利用逐渐引发社会的广泛关注。高架桥及其附属空间作为高架桥基础设施的附属产物,其具备交通空间和公共空间的属性,但其现状不合理的利用造成了大量的空间浪费,对其进行合理的更新利用能很好缓解公共空间短缺的现状,缝合被道路切断的城市肌理,链接城市居民的生活,优化
招商引资,作为地方政府加快经济发展的重要手段,不仅能促进当地经济发展、优化区域产业结构,还可以促进人员就业,以此来增加地方的财政收入。尤其对经济欠发达的县级市而言,招商引资更是推动当地经济发展的强大动力源。因此,各级地方政府都把招商引资工作视为促进经济发展的第一要务来抓。由于多种因素的影响,很多地方的招商引资并没有达到预期的效果。磐石市作为一个县级市,招商引资工作多年来取得了一定成绩,但随着我国进
如今线上与线下渠道并存的销售模式被企业广泛采用,这对提高企业分销效率与顾客满意度有重要意义。但市场需求不确定与各种意外因素的存在,如何解决由供需不平衡引发的库存风
在新常态下,中国经济结构正在产生着巨大变化。通过供给侧结构性改革,推进产业升级和消费者需求转型,整体经济增速逐渐回落。现有的生产能力过剩、不足的投资和消费需求、成
半监督学习是机器学习领域中的一个重要研究方向,高维半监督学习算法的研究是半监督学习中的一个重要研究课题。随着信息技术的快速发展,在机器学习、模式识别、数据挖掘和计