【摘 要】
:
由于音乐数量的迅速增加,音乐分类的应用需求更为突出。音乐流派分类(MGC)是一种基于内容的音乐分析,在音乐检索中起着重要作用。虽然音乐分类算法已经取得了令人瞩目的成果,但在提高准确性、训练和超参数设置方面仍具挑战性。卷积神经网络(CNN)可提取低级特征,但不能保持长期依赖性。递归神经网络(RNN)虽可以保持长期依赖性,但仍存在梯度消失的问题,亟待研究音乐数据库智能高
论文部分内容阅读
由于音乐数量的迅速增加,音乐分类的应用需求更为突出。音乐流派分类(MGC)是一种基于内容的音乐分析,在音乐检索中起着重要作用。虽然音乐分类算法已经取得了令人瞩目的成果,但在提高准确性、训练和超参数设置方面仍具挑战性。卷积神经网络(CNN)可提取低级特征,但不能保持长期依赖性。递归神经网络(RNN)虽可以保持长期依赖性,但仍存在梯度消失的问题,亟待研究音乐数据库智能高效的技术。本文研究具有适当归一化、正则化和平衡超参数设置的深度神经体系结构,以用于音乐分类和模型训练。主要研究进展如下:(1)为解决层数过多而导致的模型复杂问题,提出了一种结合CNN和残差学习的改进方法用于音乐流派分类。此方法用梅尔频谱图作为输入,使用不同池化技术的CNN层来提供更丰富的分类信息。残差学习使用的卷积网络跳过了不重要的学习步骤,从而避免了网络的复杂性。该模型在GTZAN和FMA数据集上进行的实验表明,两个数据集的分类准确度分别为87.80%和68.50%。(2)为解决网络训练复杂度和分类精度问题,提出了一种基于全局层归一化的CNN和RNN混合模型。CNN使用质谱图自动提取低级特征,从而消除了对人工干预的需求,而RNN执行时间聚合并保持长期依赖性。层归一化有效地代替了传统的批量归一化。将统计信息与功能维度一起计算,提高了音乐数据隐藏状态的动态性。实验结果表明,全局归一化联合神经体系结构改进了模型训练,该模型在GTZAN和FMA数据集上的平均准确度分别为89.79%和68.78%,提高了分类准确性。(3)为解决音乐分类中RNN梯度消失的问题,提出了一种结合CNN和改进RNN的混合模型。RNN的改进包括有长短期记忆LSTM、双向长短期记忆Bi-LSTM、门控循环单元GRU和双向门控循环单元Bi-GRU。本文使用MFCC和梅尔谱图特征,比较了不同的网络结构,并比较了所提出混合模型的性能。基于GTZAN数据集的实验表明,CNN和LSTM的混合模型对于MFCC特征的分类准确率达到了76.40%,而CNN和Bi-GRU的组合获得了89.40%的准确率。
其他文献
分类号密级UBC編号10736硕士学位论文(专业学位)自闭症儿童家庭亲职压力的小组工作介入研究研宄生姓名:冉玫珑校内指导教师姓名、职称:马克林教授?
目的:社区居家养老是我国当前养老服务体系建设中最基础也是最重要的环节,是改善老年人养老问题的有效解决方式之一。本研究以社区居家养老体系建设为背景,阐述了社区居家养老服务体系建设的现状,之后以安德森卫生服务利用行为模型为基础,结合德尔菲专家咨询法,构建针对社区老年人利用社区居家养老服务的评价指标体系,并用该指标体系开展实证研究,选择南京某建设相对完善的社区居家养老服务中心辐射范围内的老年人为研究对象
目的基于互联网医疗平台的药诊店服务模式(简称“药诊店服务模式”)是互联网信息技术和远程医疗相结合而形成的医疗服务新业态。在当前我国正面临着医疗卫生资源相对短缺且分配不均衡、零售药店受政策及市场的冲击、分级诊疗制度在利益固化的形势下难以实施等困境,互联网医疗平台与零售药店通过合作的方式,利用互联网技术手段连接分散的医疗资源,提高了医疗资源的利用率,使常见病、多发病、慢性病复诊患者可通过非医院途径,在
家庭教育支出反映了父母对子女教育的支持力度,父母教育期望则反映了父母对子女教育的主观期待,本文从家庭人力资本视角出发,基于家庭教育支出决策理论、新人力资本理论以及罗森塔尔效应,运用中国教育追踪调查(CEPS)2014—2015学年追访数据,从学校教育支出和课外辅导费用两个方面检验家庭教育支出对子女认知能力的直接影响,进而探讨父母教育期望对家庭教育支出影响子女认知能力发展的调节效应。研究发现:(1)
随着我国经济飞速发展,人口规模不断扩大,城市生活垃圾急剧上升,随之而来的是一系列环境污染问题,严重影响到经济可持续发展以及生态文明建设。我国政府越来越重视城市生活垃圾治理问题,第十九届全国人民代表大会上,习近平总书记提出构建政府为主导、企业为主体、社会组织和公众共同参与的环境治理体系,为城市生活垃圾治理提供了重要的方向指引和根本政治保障。 当前我国大多数城市面临着“垃圾围城”的困境,通过案例分析
种姓制度作为印度的重要特征,对于印度的各方面造成了深远的影响。在种姓制度下,有一部分人被印度的普通民众歧视和压迫了许久,即印度官方定义的“落后阶层”。其中表列种姓和表列部落占据绝大多数。这样的不公让表列种姓和表列部落的人群处于社会的最底层,难以翻身。而一个国家要得到发展则绝不可能丢下国内的任何一类人。在印度独立后,印度政府为了推进国家的进一步发展以及保护表列种姓和表列部落的权利,实现社会公平,印度
党的十九大报告提出“各级党组织要关心爱护基层干部,主动为他们排忧解难”。公务员是推动国家政策落实的主要承担者,也是地方公共事务的直接执行者,在政府管理中发挥着重要作用。我国公务员队伍庞大,据统计,截至2018年我国公务员总人数达到719万,其中基层公务员的数量超过60%。作为国家政策的一线执行者,基层公务员直接面对社会大众,工作任务繁重、工作难度大、工资待遇低等因素使基层公务员在工作中承担较大的工
随着彩色成像技术的成熟和彩色图像的普及,颜色信息在计算机视觉任务中受到了越来越多的重视。颜色是一种光学特性,已有的算法所提取的颜色特征极不稳定。计算机视觉要想拥有和人眼一样卓越的颜色信息处理能力,只有从人类视觉功能出发,且充分利用神经网络强大的特征提取能力。当前人工智能的浪潮已席卷了全球,人工智能领域的公司也在不断激增。仿生视觉是突破人工智能发展瓶颈的关键。将人类视
目的探讨移动护理信息系统PDA在肺结核患者健康教育中的应用效果。方法选择2018年6-11月入住我院结核患者120例,对比引入PDA前后的护理效果,6-8月未使用60例,按常规方式进行健康宣教,9-11月引入PDA后60例患者,应用移动护理信息系统进行健康宣教。比较两组患者的健康知识水平、对护理服务满意度以及治疗护理依从性。结果患者对结核病相关知识水平明显提高,治疗
可降解的高分子纳米材料被广泛用于药物递送的研究,但往往仅被作为载体。针对其降解过程以及降解产物是否能在生理环境中诱发特殊的生物、化学反应的研究仍然较少。首先,我们基于配位开环聚合,构建了一种具有生物医用价值的两亲性聚酯材料[1]。该聚酯采用了源自生物新陈代谢中间体的单体,其降解产物能调节细胞内化学环境,直接参与细胞行为调控。自组装形成纳米药物载体后,可与所载药物协同