基于深度学习的环境声音分类研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:akk871204
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
城市环境声音的自动分类,已经成为城市信息化进程中的一个关键点,是指通过计算机自动化的分类手段,针对不同的城市环境声音,如自然环境声音、家庭环境声音、道路环境声音等等,在具备背景噪音的情况下,来识别和分类出周围环境的状况。虽然目前环境声音分类领域的应用潜力巨大,但是效果却还不是特别理想,相对于语音识别和音乐检索这样的热点,环境声音的研究还有很多方面的工作可以进一步深化。本文主要针对环境声音的分类问题,进行了相关的研究。在围绕分类的模型选择和有标记数据集匮乏两大问题上,分别提出了对应的解决方案,并通过实验对本文提出的相关方法进行了验证。主要工作包括了以下三个方面:第一,对环境声音分类研究的发展状况以及当前主流的研究方法进行了综述。第二,目前,环境声音分类主要采用底层特征提取结合无监督聚类的方法,这类方法存在着分类准确率有限的问题,即使有的学者将CNN用于环境声音分类,但由于使用的是原始声音数据,从而造成计算代价过大。为此,本文提出了一种基于MFCC结合CNN的混合模型分类方法,该方法首先进行MFCC底层特征提取,然后,再通过CNN模型对其进行高层特征提取,最后进行Softmax分类。实验结果表明:本文提出的混合模型方法,在兼顾计算复杂性和准确率方面,都具有较好的效果。第三,针对当下的环境声音数据集面临着数量少、规模小的困境,提出了声音数据集扩充的办法,该方法共选用了四类数据扩充算法,对原有数据集进行扩充,随后本文将扩充后的数据集在CNN网络中进行训练,实验结果表明:本文提出的数据集扩充方法,其在提高CNN网络的分类准确度方面有明显的优势,能够获得较好的效果。
其他文献
世界各国的竞争越演越烈,国与国之间的较量关键在于人才。在我国,高考是国家、社会对各行人才选拔的最重要的途径。生物科学是自然科学中的基础学科,是研究生命现象和生命活
目的:比较肺炎支原体感染后咳嗽患儿在治疗前后各项积分指标的变化,观察养阴清肺汤加减对肺炎支原体感染后咳嗽(阴虚证)患儿的临床疗效。方法:将2018年9月至2019年12月就诊于
间套作技术是一种充分利用自然资源,提高土壤产出率,增加农民受益,生态环保的农业种植技术。大豆间套作历经数十年的发展,已经形成了一定的规模,在全国范围内广泛应用。文章
近年来,有关中职学生的违法犯罪事件频现,并得到了社会的广泛关注和重视。中职学生自身的法律素养在法治国家、法治社会的建设背景下必须得到进一步的提升,故中职学校法律教
目的:观察温化胶囊对肿瘤增殖、分化、凋亡与细胞周期等细胞生物学行为的影响及其细胞毒作用。方法:人肝癌B el-402细胞用含10%小牛血清的RPMI-1640培养基培养,分别于加药后30
研究D860阳离子交换树脂对Ⅴ(Ⅳ)的吸附性能,进行pH、平衡吸附时间、温度和Ⅴ(Ⅳ)初始浓度试验,分析了吸附过程的热力学、动力学特征以及等温吸附模型,同时研究了共存杂质离子对D
服装是人体的外包装,它的产品和计算机、电子、通讯、机械等高科技产品相比要简单的多,它属于机器、手工并用、劳动力密集的行业。学习服装裁剪并不难,它是一门简单的技艺,却
针对现今新型本科院校的增多,首先阐述了新型本科院校定位于应用型本科的原因,然后介绍了应用型服装类专业人才及其培养模式,最后从地方经济建设和高等院校的关系着手,指出应以服