【摘 要】
:
听觉是人类感知周围环境的一个重要途径,通过听声音我们可以获取众多信息。声音识别目前被应用于多个领域,具有巨大的生产生活价值,其中语音识别技术已经比较成熟,而环境声音由于其复杂性,成熟程度和应用程度远不如语音识别。声音识别在初期是通过提取音频的传统声学特征,再用统计分析进行分类的方法实现的。近年来,深度学习(Deep Learning)飞速发展,被应用于包括声音识别在内的众多领域。深度学习在声音识别
论文部分内容阅读
听觉是人类感知周围环境的一个重要途径,通过听声音我们可以获取众多信息。声音识别目前被应用于多个领域,具有巨大的生产生活价值,其中语音识别技术已经比较成熟,而环境声音由于其复杂性,成熟程度和应用程度远不如语音识别。声音识别在初期是通过提取音频的传统声学特征,再用统计分析进行分类的方法实现的。近年来,深度学习(Deep Learning)飞速发展,被应用于包括声音识别在内的众多领域。深度学习在声音识别领域的应用,大幅提升了环境声音识别准确率。人工神经网络是深度学习的基础。随着应用场景的愈发复杂,神经网络算法也变得更为复杂,且规模不断增大。声音识别是应用型技术,只有准确率高、识别速度快才能被实际应用。目前靠指令流的通用处理器的计算速度、存储资源、带宽等难以满足深度越来越大的神经网络的计算需求,因此大家将目光转向了专用集成电路(Application Specific Integrated Circuit,ASIC)和现场可编程逻辑器件(Field Programmable Gate Array,FPGA)等硬件平台上。在硬件平台上数据计算不依靠指令,而是以流水线方式移动,因此计算速度较处理器更快。本文将环境声音数据集Ubandsound8K中十种声源目标的快速准确分类作为设计目标,把深度学习与专用计算硬件结合,设计了一个基于深度学习的专用硬件计算电路。该系统识别方案是通过提取音频的梅尔频谱(Mel Spectrum),然后将其输入卷积神经网络(Convolutional Neural Networks,CNN)以提取高级特征实现分类实现的。设计实现的硬件加速器包括两个模块,分别是梅尔频谱提取模块和CNN模块。梅尔频谱提取模块由预加重模块、分帧加窗模块、FFT计算模块、Mel滤波器模块以及控制模块五个子模块组成。CNN模块以前向加速为目标设计了一种逐层计算的硬件计算架构。CNN模块中设计了一个共享计算模块,所有卷积层与全连接层均通过该模块计算,在计算前根据控制模块的控制信号配置共享计算模块。论文分析了CNN的算法特点,根据各层特点设计了输入通道并行、输出通道并行和卷积核内并行三种并行计算方法,实现了数据在空间上的复用。最后,在Xilinx的Vivado设计环境下实现了加速器系统的设计、综合以及自下而上的模块仿真验证,并在CPU、GPU和本文设计的专用计算电路上使用同种网络模型识别图片,对比各个平台的识别速度。本文设计实现的声源识别专用加速器并行度高、识别性能以及识别速度较高,相较于测试所用的CPU和GPU,识别时间分别降低71.9%和38%。
其他文献
在机械零部件制造加工行业中,铸造件内部缺陷检测是生产质量检查的关键一环,而目前,多数铸造加工厂仍然存在使用人工观察DR(digital radiography)图像来检查缺陷的方式。这种方法效率低下,且经常因人为原因造成漏判,效果不佳;随着计算机技术的发展,越来越多的研究人员使用计算机算法代替人工检测。然而,传统的计算机视觉方法普遍缺乏准确性和鲁棒性。为了解决如上问题,提高铸造件DR图像缺陷检测的
隧道掘进机(TBM)的应用已成为当下主流的隧道施工方式。而在掘进过程中,刀具在破岩时逐渐磨损,影响掘进效率,因此,更换磨损的刀具成为了施工过程中不可或缺的任务。目前,人工换刀效率低、风险大的弊端,引起重视;“机器代人”换刀成为了研究的热点。国内外机构对此进行了广泛的研究,提出了多种换刀机器人方案,但在物理实验和工程应用上取得进一步进展的较少。本文基于7.8m直径的TBM换刀机器人搭建了缩尺物理样机
金属零部件在复杂的工况条件下,如高温高湿、冲击、振动以及大负载等,很容易在零部件表面产生各种微小的裂纹。如果不能及时发现而任由其不断扩展,会引发严重的安全隐患,甚至造成严重的安全事故。激光超声作为一种新兴的超声无损检测技术,凭借其独有的优势,在无损检测领域展现出良好的应用前景。在目前主流的检测方法中,实现对表面裂纹的判别主要依赖于使用多种信号处理手段从超声波的反射以及透射波信号中提取出相关的时频域
目的分析抑郁症患者功能性消化不良(FD)、肠易激综合征(IBS)以及FD合并IBS的患病情况。方法选取2020年7月-2021年2月安徽医科大学附属巢湖医院收治的抑郁症患者200例作为观察组,另选取同期在我院进行体检的健康人群200例作为对照组。研究对象均进行问卷调查,比较两组FD、IBS、FD合并IBS的患病情况,观察组中不同性别FD、IBS、FD合并IBS的患病情况,以及观察组中有无胃肠道症状
随着当前社会人口老龄化趋势的不断加剧,由于脊柱损伤、脑卒中、脑血栓等中枢神经系统疾病引起的下肢运动功能障碍患者的人数不断上升,患者对于重新行走的渴望日益强烈。下肢助行外骨骼机器人作为智能机器人技术与康复医疗理论相结合的新产物,可以通过为不同身体状况的患者提供正确合理的助行方案,帮助患者完成日常生活中的行走动作。国内外科研机构对下肢助行外骨骼机器人进行了大量研究,提出了很多行走规划方法,但应用场景只
激光熔覆在增材制造技术中应用广泛,常用在零部件直接成型以及复杂零件修复等领域。激光熔覆中大多数的应用都需要多层堆积加工,而加工件的质量与离焦量息息相关。在加工过程中,由于熔池温度与累积误差等原因,会使得熔覆层的高度处于不断变化中从而导致离焦量的变化,因离焦量的不稳定易导致熔覆层组织性能不稳定,而造成最终工件质量不佳。因此,为在加工复杂零件如环形件或梯度材料时,可以获得尺寸精度较高的熔覆层,需要对离
随着国内网球运动的普及,更多人喜欢上这项运动,但是网球训练者要背负繁重的捡球劳动,同时市场上又缺少相关的解决方案。本文通过研发一款服务机器人代替运动员进行网球自动拾取。针对网球拾取实际工况,结合移动机器人开发特点,网球机器人需要具备稳健高效的控制系统软、硬件和稳定可靠的机械结构。在网球机器人控制系统软件方面,分析了FreeRTOS嵌入式实时系统的多任务架构;基于多任务管理与调度原理以及系统裁剪与移
人类从出生到老去可以一直的学习和积累知识,并能够对学习到的技能进行存储记忆,实现有效的重复利用知识以快速解决新任务的。研究机器人技能的学习方法,使其在学习过程中掌握完成任务所需技能,记住训练过任务中经历过的多个片段,并能够进行整合应用到新任务中。本文分章节开展了基于情景记忆和元学习的机械臂运动技能获取研究,研究内容主要从以下几个方面展开:首先,设计了物体识别定位和操作系统(Object recog
河北省“三高”(1)行业的发展现状严重制约碳排放达峰和空气质量达标协同目标进程。减污降碳归根到底要转变发展方式,关键在于经济转型突破碳约束的产业布局,形成绿色发展合力。绿色金融作为支撑生态文明建设的金融体系,以其特有的运作方式将资源环境的高度稀缺性在金融的资源配置中体现出来,为绿色低碳投入和产出提供市场化、货币化转换通道,引导社会资本逐步从“三高”行业退出转投绿色低碳领域,是破除传统发展路径依赖、
心电图是临床上诊断心脏电生理相关疾病的重要手段,能够反映心肌的兴奋性、自律性和传导性。然而,全球每天上百万条心电记录的判断对于医师是一个耗时且容易出错的工作,开发自动检测算法辅助医师进行异常心律检测具有重要的意义。近年来,在各个心电节律分类挑战赛的推进下,关于心律失常的研究也不再只是针对心拍的分类,开始识别长时程心电记录中的心律失常。多个公开数据集的出现也为这类自动识别算法的开发提供了条件。本文结