基于旋律特征的实时音乐检索系统

来源 :东南大学 | 被引量 : 2次 | 上传用户:Augustin413
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为一种人类情感表达的产物,音乐已经成为了人们生活的一部分。目前音乐检索技术虽然已经得到了广泛的应用,但是传统的音乐检索技术还是具有一定的缺陷和不足之处,例如它并没有基于音乐本身的特性,而且需要花费大量的人力和时间来对每首歌曲进行标注,更重要的是,在用户只记得旋律的情况下,传统的检索系统对此束手无策。因此,针对传统音乐检索技术的缺陷和不足之处,本文提出了一种基于复合音乐数据库的哼唱检索系统,它利用音乐本身的旋律特性来辨识音乐,是一种更便捷、更高效的音乐检索方式。旋律是音乐的灵魂,是辨识音乐时应用最多的、最具代表性的特征。本文在现有成果和技术的基础上,基于音乐的旋律特征,实现了一个哼唱检索系统,并在以下几个方面开展研究:(1)提出并实现了一个基于复合音乐数据库的哼唱检索系统。在传统的基于旋律的哼唱检索系统中,音乐数据库是MIDI数据库,MIDI并不含有人声,而且为每首音乐都制作MIDI文件并不现实,因此基于复合音乐数据库实现的哼唱检索系统扩大了哼唱检索的应用范围,具有更大的实用价值。(2)分别研究了单声哼唱基频提取的算法和复合音乐人声基频提取算法,提出了一种改进的倒谱法进行哼唱基频提取,以及归纳和比较两类复合音乐人声基频提取算法,并使用MELODIA算法进行复合音乐数据库人声基频提取。(3)提出了一种新的结合LS和DTW算法的匹配检索引擎设计方案。匹配算法是哼唱检索系统的核心。哼唱的速率变化、哼唱音频质量、哼唱时音调的偏差都是匹配算法需要考虑的重要因素,本文采用以最小距离原则结合LS和DTW,具有较少的检索时间和较高的检索准确率。(4)基于C/S模式实现了本文提出的哼唱检索系统。前端基于Android平台,包含录音、VAD检测等模块;服务器后端基于Linux平台,包含基频的提取、数据库的管理、基频序列的匹配等模块。进行了大量的系统测试,验证了本文的哼唱检索系统具有良好的性能。
其他文献
文物是文化传承的重要载体,但是受自然环境与人类活动的影响,文物会出现不同程度的损毁,修复文物、还原文物全貌一直是各大文物修复基地工作的重点。传统文物修复采用手工翻
目的 摸索磷酸苯丙哌林分散片含量的测定方法。②方法 采用高效液相色谱法进行含量测定。③结果 该方法能很好地排除各种辅料对主药磷酸苯丙哌林含量测定的影响 ,线性和重
Au80-Sn20(wt.%)共晶合金具有高强度、高导热性、高蠕变与疲劳抗力以及免助焊剂焊钎等性能,被认为是光电子封装技术领域中最具应用前景的无铅钎料之一。目前,倒装结构已成为
摘要:随着专业化分工的细化,越来越多的市场主体参与房地产开发活动并从中获利,同时也使得开发活动中的交易成本增加,并提升了房地产价格。面对居高不下的房价,普通居民只能“
在桥梁工程中,桩基础被广泛采用,因此有着极其重要的地位。由于桩的施工的隐蔽性较大,很难及时地发现并处理问题,所以在桩基工程的全过程中的桩基检测环节就显得尤为重要。本
由于低空环境复杂、目标雷达散射截面积(Radar Cross Section,RCS)小以及目标运动特性复杂,传统雷达系统对于多旋翼无人机目标的探测能力极为有限,亟需掌握无人机目标雷达探
张杨导演的《冈仁波齐》是一部带有纪录色彩的剧情片,影片打破了常规的电影制作流程,在开始拍摄之前不做情节上的安排,而是在体验藏地日常生活的过程中提取影片内容,运用纪录
【正】 事物发展变化的周期性是一种普遍存在的客观现象。台湾经济发展也存在着周期惯势波动规律,呈现出一个波浪式的演进过程。探讨这一周期性波动,对于认识战后台湾经济增
截至2016年6月底,我国职工上网人数已达2.77亿。工会工作阵地已经发生历史性变化,网络已经成为服务职工群众的主战场,脱离互联网就是脱离群众。树立互联网思维,不断提高运用
通过对集市交易内容、交易变化的调查,本文简略分析了在市场经济与现代化浪潮冲击下的集市文化、交易方式、村民交际等。基于河北省L镇春节前后集市中的文化因素来透视现代化