乐曲与歌声分离算法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:hua50776007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息时代下,音乐信息数量不断增涨,导致对音乐信息的检索、识别、处理需求与日俱增。然而背景乐曲与歌声往往具有相关性,它们之间的相互干扰给音乐信息处理带来了巨大障碍。音乐分离技术的研究给上述问题带来了新的探索方向。本文主要研究乐曲和歌声分离问题。在统计技术和计算听觉场景分析技术两大理论下,对NMF分离技术、音乐信息特征分析技术、听觉声学模型进行了研究。在此基础上,重点对音乐反复结构建立和背景乐曲提取等问题进行了深入研究,最后对基于音乐反复性的乐曲和歌声分离算法中存在的问题进行了一些改进,主要创新点有以下两个方面:(1)基于多反复结构的音乐分离音乐信号是随着时间变化而变化的,因此音乐的反复特征也是随音乐的变化而变化的。本文提出了一种基于多反复结构的音乐分离算法,通过多反复结构模型来更好的符合音乐自身变化的特点,并且利用了MFCC特征来建立反复结构模型。通过实验结果表明,该方法能较真实的反映音乐本身的反复性,一定程度上提高分离性能。(2)基于音源类型分析的音乐分离在以往的反复分离算法中,节奏缓慢,韵律较弱的音源容易被反复模型忽略掉,为了能较好的分离出这一类音源,本文采用了谐波、冲击源分离思想,促进这类音源的分离性能改善。通过谐波、冲击源分离思想和多反复结构模型共同作用对背景乐曲中不同类型音源进行分别分离。实验结果表明,对节奏韵律弱的音源进行单独分离后,大大减少了歌声中残留的乐曲音源,从而改善了分离性能。
其他文献
由于扩频通信具有保密性好,抗干扰性强的特点,因此在各个领域内倍受关注,至今,扩频通信技术已经被非常广泛的运用在军事、民事、和商业领域。扩频通信系统虽然优点众多,运用
图像分割作为多数基于图像分析智能技术的基础,在自然、遥感、医学图像分析等领域均有广泛应用。变分水平集方法以其良好的拓扑结构变换、多种驱动能量优化融合以及有效的数
为解决传统暗原色先验的单幅图像去雾算法实现效率低以及恢复雾化图像在天空、白云等明亮区域颜色失真的不足。实现一种改进方法,通过分块思想,完成透射率的空间自适应估计;通
变化检测技术是遥感图像处理的重要应用之一。遥感图像变化检测是通过对同一区域不同时期的两幅已配准的遥感图像进行分析,检测出该区域地表变化信息的过程。变化检测技术在自然灾害监测、生态环境监测、战场动态监视等领域得到了广泛的应用。本文主要研究了基于分数阶Fourier变换(Fractional Fourier Transform, FRFT)和Gabor小波的遥感图像变化检测算法,主要内容如下所述:1、
三维电视(3DTV)技术能够录制、传输和显示三维彩色图像,使观众能在欣赏电视节目时产生身临其境的真实感。近几年,裸眼3DTV由于无需借助立体眼镜即可裸眼体验立体感觉而成为目
透地通信采用大地介质作为传输信道,信道特性稳定,不易受灾害的影响,因而在矿山、地质等灾害救援等方面起着重要作用。但是地层环境非常复杂,对高频电磁波衰减非常严重,因此
在基于内容的检索领域中,音频检索是新发展起来的研究热点。音乐哼唱检索是基于内容的音频检索的一个分支,它提供了一种新颖、方便的音乐检索方法,当人们遗忘了歌曲的歌名等
随着互联网技术的飞速发展以及电子产品的普及,图像已经成为一种重要的信息载体。如何提取图像的有效信息成为制约计算机视觉发展的关键因素。图像显著性检测可以有效的区分
近年来,随着移动互联网的高速发展和手机等智能移动终端的普及,QR码(quick response code)已经迅速成为信息交流的主要方式之一。人们可以用手机扫码来上网、购物、交友、支
随着现代科技的发展,由诸如目标跟踪、对象识别等图像视频处理技术发展而成的应用软件已经在移动终端得到了广泛地应用。很多传统的图像处理技术只能满足对低分辨图像进行实