基于深度神经网络的音乐流派分类研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:pearl12345
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如今随着互联网技术的飞速发展,在线的音乐服务逐渐成为人们收听音乐作品最便捷和主要的方式。面对海量的音乐作品,音乐信息检索系统性能关系到音乐服务的质量,其中的自动流派分类技术是基于内容的音乐信息检索的重要组成部分,因而成为了近年来研究的热点。音乐信号具有复杂的频率构成和丰富的语义信息,找到对音乐的有效特征表达是流派分类的关键。本文基于深度学习的方法,对音乐信号进行建模分析,通过深度神经网络进行自动的学习,获取信号中与流派相关的语义信息和时频特征表达,从而提高分类的准确率。具体工作和创新点如下:1.研究了音乐信号的语义信息提取,提出使用循环神经网络的流派分类算法。由于传统的特征都是基于语音信号的短时平稳特性,而语义信息则蕴藏在较长时间段的上下文中。因此,可以利用循环神经网络的记忆特性,对短时特征组成的特征序列进行学习,获取其中的上下文信息。实验结果表明,使用了循环神经网络后获得的语义特征比原始的短时特征的统计量能更好地描述分析窗长内的音乐特性,在GTZAN和ISMIR2004两个数据集上的分类准确率分别达到81.85%和83.7%。2.研究了音乐信号的时频特征自动提取,提出使用卷积神经网络的音乐流派分类算法。语音信号的声谱图能反映出一段音频的时频特性,以声谱图作为原始输入,利用卷积神经网络的局部和全局感知特性,从声谱图中体现的频率分布和变化中学习局部特征,通过多层卷积将局部特征进行组合形成了高层和全局的表达。同时,在卷积网络中加入了残差单元和随机深度策略,提升网络性能。最后,将卷积神经网络和循环神经网络的优点相结合,提出卷积循环神经网络,完成了从声谱图到分类结果的端到端的流派分类算法。实验中,卷积循环神经网络在GTZAN和ISMIR2004两个数据集上的分类准确率分别达到88.16%和89.93%,超过了目前基于卷积神经网络和手工特征的分类算法。本文提出的音乐流派分类算法,有助于音乐信号的高层语义特征提取的研究,以及推进深度学习方法在音乐信号分析领域的应用。
其他文献
事业单位人力资源管理创新思路的建立要充分的融入科学理念,根据组织发展要求调整人力资源管理方法,良好的协调人力资源管理创新思路要求,最大限度地满足事业单位体制转型。
事业单位是我国优秀人才的聚集地,承担着重要的社会职能。随着市场经济的快速增长,社会对事业单位人力资源管理提出了更高的要求,因此加强事业单位内部人力资源管理势在必行
<正>周捨是南朝梁武帝時的重臣,其卒年通常以爲在普通五年(524)~②,然有異説。《梁書》卷二五《周捨傳》云:"普通五年,南津獲武陵太守白渦書,許遺捨面錢百萬,津司以聞。雖書
<正>至今为止,有关建构主义的应用和建构主义学习环境的设计问题始终受到极大的关注。建构主义提出的有关学习和支持学习的过程的一整套假设,完全不同于基于传统课程的教学设
2006年中国家庭健康与营养调查(CHNS)的成人数据显示,中国年轻一代农村劳动力的非农劳动参与率明显高于上一代农村劳动力,年轻农村劳动力是中国非农劳动力供给的主体。本文在
支链氨基酸(branched-chain amino acids,BCAA)包括亮氨酸、异亮氨酸和缬氨酸,是人体营养必需氨基酸。它们不仅是蛋白质的基本组成单位,也可作为信号分子调节糖脂代谢、凋亡
目的:观察颈夹脊穴傍针刺法对神经根型颈椎病的镇痛作用。方法:将60例神经根型颈椎病患者按随机数字表法分为治疗组和对照组。治疗组采用颈夹脊穴傍针刺法,对照组采用常规针
某工程地下部分采用逆作法施工,上部采用顺作法施工。对逆作法施工中关键部位施工工艺、质量控制要点等进行论述。
在新课程地区实施3年以上的高中教师对新课程的适应性并不乐观,因此教师在新课改中的适应性研究具有一定的紧迫性。在课程改革中,教师是最终执行者和操作者,而在新课改中高中
<正>前言改革开放以来,我国食品工业有了飞速的发展,食品工业总产值占农业总产值的比重已由92年的36%上升到97年的43%,去年总产值已达5000亿元左右,但是,我们的食品工业总产
会议