论文部分内容阅读
现实生活中,经常会遇到以下情况。当走在大街上突然听到一首引人注意的歌曲,它很可能就是非常喜欢的一首音乐,但是刹那间无法想起它的名称以及演唱者。这样就不可能利用音乐名称或者演唱者等元数据信息进行检索了。音乐指纹(简称乐纹)提供了基于内容的查询方法:对一个未知的音乐片段提取乐纹以检索到其对应的音乐。本文提出了一个基于乐纹的音乐检索系统,利用计算机及数据压缩技术提取能够表征音乐特征的乐纹。通过乐纹能够快速有效的查询到所要的音乐。 乐纹提取是根据不同音乐能量分布不同的基础上进行分析提取的,而这些分布情况与音乐的频率和时间也是息息相关的。首先,利用傅里叶变换把音乐信号转换成频谱信息。接着利用小波变换,并只保留Top-N个小波系数提取频谱包络图。最后,使用MinHash的方法压缩,把Top-N个小波系数用P个值来表示。这样的一组P个值就构成了一个子乐纹。 在乐纹数据库中检索一个提取的乐纹并不是一件轻而易举的事。目标是找到最相似的乐纹,而不是对所有歌曲的乐纹逐一比较。为了达到这个目的,利用了局部敏感哈希的方法。对于每一个子乐纹,把它切分为B组,每组R个值。其中R=P/B。那些被切分到同一组的乐纹对应的歌曲称为候选集。只比较候选集乐纹之间的相似性以检索到最相似的歌曲。 通过大量的实验验证了基于乐纹的音乐检索系统的性能。实验结果表明,在数据库大小为10,000首音乐的情况下,系统查询的准确率达到了82%,平均时间为6.4s,取得了良好的效果。 基于乐纹的音乐检索系统具有广泛的应用性。它可以为终端客户提供歌曲识别的功能,这样对于那些用户未知的音乐就可以被自动标注上名称、专辑、歌手等元数据。它也可以提供音正版歌曲授权和防盗版维护的服务。