基于哼唱搜索的音乐检索系统研究

被引量 : 1次 | 上传用户:zuomingyu6
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于音频内容的搜索方式在哼唱的检索领域应用非常普遍。本文旨在实现一个基本的基于用户哼唱的音频搜索系统。该系统的具体实现主要涉及三个技术的难点。首先我们需要研究解决的就是如何提取音频的特征曲线。第二个我们需要研究解决的就是如何构造MIDI特征库。第三个需要研究解决的就是如何从特征库中检索出结果即旋律匹配算法的实现。本文在第一个技术难点上的工作主要包括音频的预处理和提取音频特征旋律曲线。我们想要得到一段噪声比较小的音频数据,所以就必须去噪。我们采用卡尔曼滤波的方法先对输入的音频信号简单去噪,然后预加重,我们使用的方法是高通滤波,最后汉明加窗。这样我们就可以提取处理后音频的特征。我们讨论了各种现有的特征提取算法,最终选定改进的AMDF平均幅度差方法,并使用matlab实现了该算法,完成了输入音频的特征提取。本文在第二个技术难点上的工作主要就是如何提取MIDI中的特征曲线,并构建音频特征数据库。我们分析了MIDI的文件格式,利用了第三方MIDI库读取MIDI文件的数据,并结合轮廓线算法和最佳k音轨旋律算法,最终我们得到了MIDI文件的音高特征曲线并且写入文件,该文件中存储的数据是旋律匹配模块中的特征数据。本文的第三个难点是如何从特征库中查找用户需要的音乐。本文在这一方面的工作主要是分析了现有的旋律匹配算法,主要包括基于字符串的匹配算法、基于统计的HMM的算法以及基于动态时间规整(DTW)的算法。最终我们选定了动态时间规整算法来进行旋律识别,并且考虑到实际检索中的通用性,我们对该算法做了改进,改进后的算法可以匹配用户的任意哼唱旋律片段。最后,我们使用以上的研究成果构建了一个简单的基于哼唱搜索的音乐检索系统,实现了以上提及的所有的功能模块,并且测试了该系统的功能。最终我们完成了整个系统的所有工作。
其他文献
知识经济时代,企业环境日新月异,创新被视为企业前行的保护伞,尤其在当前“大众创业、万众创新”的现实环境下,创新已经引起企业的高度重视。创新的实质是人才驱动,只有员工
对城市内部居住环境质量展开评价,利于充分了解城市内部空间与结构差异及其形成机制,对于改善居住环境质量具有重的指导意义,同时还可为政府制定相应的政策提供可靠的依据.完
辰州傩戏是国家级非物质文化遗产项目。黄生福是辰州傩戏的县级传承人,不仅熟悉辰州傩的各类法事,还擅长唱傩戏和上刀山、下火海等傩技表演。访谈中,黄生福讲述了自己艰苦卓
<正>2013年是湖南省家庭农场发展的"分水岭"。之前,全省没有1家在工商部门登记注册的家庭农场。2013年中央1号文件首次提出发展家庭农场,湖南省迅速响应行动,大力培育、加快
农业科技园区是当下依靠创新驱动,实施乡村振兴战略、促进农业供给侧结构深化改革的重要平台。园区立足于集聚资源创新、培育农业农村发展新动能,最大化发挥其在农业科技创新
针对江西省森林资源二类调查存在的主要问题,分别提出了相应的对策。
<正>自古以来,音乐教育都是人们生活的重要组成部分,其涉及的内容也是各国各地源远流长的优秀文化,音乐会直接影响人们的生活。音乐是一门综合性学科,将音乐教育引入学生素质
<正>9月3日上午,由席媒控股冠名的"智能建筑·智慧社会"——2018年智能建筑行业智慧发展论坛在上海召开。论坛由中国勘察设计协会工程智能设计分会主办,华东建筑设计研究总院
笔者综述了自洁抗菌陶瓷、防静电抗菌陶瓷、防辐射抗菌陶瓷、远红外保健抗菌陶瓷的研究现状,总结了多功能抗菌陶瓷的抗菌机理,并分析抗菌陶瓷存在的问题及发展趋势,旨在更好
目的:观察地塞米松预防血液透析患者皮肤瘙痒症的疗效。方法:血液透析伴发皮肤瘙痒症65例,随机分为观察组35例和对照组30例。观察组在血液透析治疗前,采用地塞米松40mg加入到