论文部分内容阅读
作为一种人类情感表达的产物,音乐已经成为了人们生活的一部分。目前音乐检索技术虽然已经得到了广泛的应用,但是传统的音乐检索技术还是具有一定的缺陷和不足之处,例如它并没有基于音乐本身的特性,而且需要花费大量的人力和时间来对每首歌曲进行标注,更重要的是,在用户只记得旋律的情况下,传统的检索系统对此束手无策。因此,针对传统音乐检索技术的缺陷和不足之处,本文提出了一种基于复合音乐数据库的哼唱检索系统,它利用音乐本身的旋律特性来辨识音乐,是一种更便捷、更高效的音乐检索方式。旋律是音乐的灵魂,是辨识音乐时应用最多的、最具代表性的特征。本文在现有成果和技术的基础上,基于音乐的旋律特征,实现了一个哼唱检索系统,并在以下几个方面开展研究:(1)提出并实现了一个基于复合音乐数据库的哼唱检索系统。在传统的基于旋律的哼唱检索系统中,音乐数据库是MIDI数据库,MIDI并不含有人声,而且为每首音乐都制作MIDI文件并不现实,因此基于复合音乐数据库实现的哼唱检索系统扩大了哼唱检索的应用范围,具有更大的实用价值。(2)分别研究了单声哼唱基频提取的算法和复合音乐人声基频提取算法,提出了一种改进的倒谱法进行哼唱基频提取,以及归纳和比较两类复合音乐人声基频提取算法,并使用MELODIA算法进行复合音乐数据库人声基频提取。(3)提出了一种新的结合LS和DTW算法的匹配检索引擎设计方案。匹配算法是哼唱检索系统的核心。哼唱的速率变化、哼唱音频质量、哼唱时音调的偏差都是匹配算法需要考虑的重要因素,本文采用以最小距离原则结合LS和DTW,具有较少的检索时间和较高的检索准确率。(4)基于C/S模式实现了本文提出的哼唱检索系统。前端基于Android平台,包含录音、VAD检测等模块;服务器后端基于Linux平台,包含基频的提取、数据库的管理、基频序列的匹配等模块。进行了大量的系统测试,验证了本文的哼唱检索系统具有良好的性能。