【摘 要】
:
环境声音识别在音频检索、监控方面有着广泛的应用,是听觉识别任务中的一个热门研究领域。但由于声音信号的复杂多变,使得该任务在识别率提升方面依然面临许多挑战。针对这一
【机 构】
:
贵州大学机械工程学院,贵州省公共大数据重点实验室
【基金项目】
:
国家自然科学基金(51475097,91746116);贵州大学面向智能装备领域的“技术众筹”研究生创新基地项目(JSZC[2016]001)资助
论文部分内容阅读
环境声音识别在音频检索、监控方面有着广泛的应用,是听觉识别任务中的一个热门研究领域。但由于声音信号的复杂多变,使得该任务在识别率提升方面依然面临许多挑战。针对这一问题提出了基于改进卷积神经网络的环境识别模型(S-CNN),该模型采用反复堆叠的递减型卷积核提取不同尺度的局部特征,并在每层卷积层后采用batch normalization(BN)层对特征进行归一化操作。同时,利用动态衰减的学习率训练模型,以提高模型收敛速度与收敛稳定性。实验结果表明,相比于传统的机器学习与卷积神经网络模型,本文所设计的改进卷积神经网络模型S-CNN具有更好的识别率。在ESC-10环境声音数据库上,识别精度达到91. 3%。
其他文献
目的:通过观察氧化苦参碱(oxymatrine,OXY)对人胃癌MGC-803细胞系裸鼠移植瘤的抑制作用,观察氧化苦参碱对该移植瘤形态学的影响,阐述其抗肿瘤作用。方法:将60只裸鼠分为阴性
<正>曾经非常喜欢顾城的那首朦胧诗《小巷》。小巷,又弯又长。我用一把钥匙,敲着厚厚的墙。这是一条怎样的小巷?在我早已沉寂的幽思里,它一定是静静地躺在江南的小镇上,幽远
笔者通过对现代扬琴作品中竹法运用的比较与分析,根据自己在教学和演奏中的体会,阐明竹法运用应适应新时代音乐创作的需要,在继承传统竹法理论的基础上进一步发扬光大,建立规
目的:观察升陷汤加减治疗食管癌术后腹泻疗效。方法:将21例患者随机分为治疗组11例和对照组10例,治疗组予升陷汤加减治疗,对照组予丙谷胺片加复方地芬诺酯片治疗。结果:治疗组总有
企业在开采、冶炼过程中,因对矿产资源的不断开发、冶炼及不合理使用,重金属污染因子经大气排放后自然沉降及雨水携带、废水收集不完全或溢流、固废处置不当经雨水冲淋浸出等
我国高职教育职业资格证书制度存在一系列不足,这不利于我国高职教育的发展,也不符合社会的需求。澳大利亚资格框架体系(AQF)是比较成熟的体系,我们可以借鉴其优点从多个方面
本文通过对动态标志、情感化理论和品牌视觉形象设计等三个方面的论述,初步总结出动态标志情感化设计在品牌视觉形象设计中的具体作用和方法。对改善品牌设计中的模式化和单
由德昌金锋橡胶有限公司申请的专利(公开号CN 108517052A,公开日期2018-09-11)'一种轮胎再生胶制备方式',涉及的轮胎再生胶制备方式包括切胶、粉碎、脱硫、二次粉碎