基于内容的音乐信息检索技术研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户：jun342546371

【摘要】

：

随着计算机多媒体技术和Interect的迅速普及，多媒体信息的应用日益广泛，数字化的音乐作为多媒体信息中的重要成员，其应用的范围也不断扩大。近年来所为人关注的网络音乐的传播、

【作者】

：

马志欣

【机构】

：

西安电子科技大学

【出处】

：

西安电子科技大学

【发表日期】

：

2006年期

【关键词】

：

音乐信息检索多媒体技术科学评估查询技术

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着计算机多媒体技术和Interect的迅速普及，多媒体信息的应用日益广泛，数字化的音乐作为多媒体信息中的重要成员，其应用的范围也不断扩大。近年来所为人关注的网络音乐的传播、共享和知识产权的问题可以使我们深信，随着数字技术以及互联网络这种特殊媒体的发展，音乐工业的传统模式以及传统的人和音乐的关系都将发生巨大的变革。数字化音乐以及互联网的发展导致对基于特定特征及需要的新的信息检索方法的需求越来越强烈。本文的主要内容就是关于利用信息技术和计算机科学的方法，对数字化音乐信息实现基于内容的方便有效的组织和检索的理论及实践性问题，同时研究了旋律感知的相关问题。通过对音乐的内容，也就是旋律这一音乐的最本质属性的研究，探讨了基于内容的音乐信息检索系统的相关技术。工作的成果体现在所设计实现的完整系统结构中，所有技术手段均围绕音乐的内容本身即旋律特征来进行实现，着重研究了音乐哼唱检索的相关技术以及基于旋律特征的音乐检索方法。进行理论研究的同时开发了一套完整的工具和系统软件，并通过实验评估了系统性能。本论文主要研究和讨论的内容及成果如下所述： 1.提出了一个全面完整的音乐信息检索系统的体系结构设计，并实现了原型系统。系统结构的设计以音乐信息数据流作为功能分割的依据，划分各部分模块，以标准化的接口设计实现系统结构和内容的分离，在开放的系统结构上支持不同的具体技术和方法实现各部分的功能，并可以合理有效地实现各种功能和性能的评估，系统的体系结构设计在系统数据库设计和查询构造及匹配检索环节均实现了对MPEG-7标准的支持，提供了基于MPEG-7的描述子，描述模式的信息处理和检索接口。 2.通过对音乐旋律特征以及数字化音乐信息的分析研究，提出一种新的音乐旋律特征的表达方式。多形态旋律特征表达针对系统的开放式设计结构以及对多种技术手段的支持，提出了同时考虑音高特征(以音高差表达)和节奏特征(以音长比表达)的旋律表达方式。对于不同的输入方式和不同应用目的的特征信息分别进行规格化处理，实现了对同一旋律进行的多形态旋律特征表达，支持包括MPEG-7标准在内的多种格式，有效地实现了对不同输入方式，不同匹配技术和不同数据组织结构的支持。 3.针对音乐信息查询的特殊性，设计实现了多模态用户接口，从考察和建立用户模型出发进行了用户接口设计。针对数字化的音乐信息表达方式，提出了全面、有效、灵活、直观易用和统一访问的设计原则，实现了对于使用等价于音符描述方式的支持和音频波形数据的支持，合理地定义了各种用户查询输入方式的表达，实现了完备的表达效果。不同的输入方式均为用户提供方便易用的图形化操作界面。并提供用户对查询输入进行调整和反馈的机制，提商了查询构造的有效性。协同的多模态和多媒体的用户接口组建成集成的功能系统，依靠统一访问和近于同构的方式实现系统的开放和有原则的集成，允许多模态和多媒体的多个颗粒度级别上的集成，通过多级分析和对话实现了对于不同模态或不同媒体的输入数据空间的所有数据元素进行统一的访问。 4.提出了一种新颖有效的音乐哼唱查询信息处理技术。这种哼唱信息处理方法结合了哼唱语音信号增强技术以及时域与频域处理技术相结合的哼唱转谱方法。包括分级音符分割方法，基于规则的基音检测、音高跟踪方法，并提出一种合理的旋律特征表达的中间格式用于哼唱查询构造。实验结果证明了这种哼唱信息处理方法的有效性。通过这种方法有效地降低了哼唱转谱过程中引入的误差，提高了旋律查询构造的准确性，进而可以有效地增强整个音乐检索系统的检索效果。 5.针对音乐哼唱查询的非精确性及哼唱方式的特点，提出一种新的模糊旋律匹配方法。将模糊集合及其方法引入到旋律特征近似匹配的过程中，对用户查询与数据库目标数据之间构造模糊隶属函数，根据隶属度来判断音高特征的相似度，同时对音长比信息进行相似度计算，两者加权得分作为动态规划匹配过程中的转换代价，最终得到两个匹配序列的编辑距离作为相关性判定标准，得到查询结果。实验结果显示模糊方法的引入提高了检索命中率，同时考虑音长特征的策略也提高了检索准确度。 6.讨论了将隐马尔可夫模型应用于音乐自动分类技术。由于隐马尔可夫模型能够很好地刻画音乐信息的时间统计特性，因此，尝试在对音乐素材的处理过程中使用隐马尔科夫模型用于音乐分类技术，对音乐进行自动分类操作，从而可以实现音乐类别信息的自动提取以及通过分类提高后续的音乐检索的效率。 7.讨论了对音乐信息捡索系统的科学评估问题。

其他文献

自适应网络安全漏洞扫描技术研究

随着计算机网络技术的不断发展，各种信息系统对计算机网络的依赖越来越强，随之产生的网络安全问题也越来越增多。网络安全的研究得到了广泛的重视，特别是对网络的安全评估已经取

学位

网络安全漏洞扫描信任度融合自适应插件库信息系统

基于Intel386EX处理器的高可靠航天嵌入式系统的设计与研制

随着航天技术日新月异的发展,人类的活动领域已经扩展到太空。人类认识太空和利用外层空间的能力也发生了质的飞跃,例如可以利用外太空的微重力环境来研究和改进半导体材料、

学位

Intel386EX处理器航天嵌入式系统可靠性

基于GP的创新设计技术研究及应用

J.R.Koza教授在1989年提出了GP(Genetic Programming)算法。GP最重要的特点之一是组成种群的个体有一种动态的树状结构。GP的基本遗传算子包括选择、交叉和变异。作为进化计

学位

GP(Genetic Programming)创新设计PSO建筑构件

基于μC/OS-Ⅱ的文件管理功能的研究与实现

随着信息技术的飞速发展,特别是互联网技术的迅速普及,3C(计算机、通讯、消费电子)合一的加速,数字化产品空前繁荣。嵌入式系统的软件技术的发展已经成为数字化产品的核心以

学位

嵌入式实时操作系统μC/OS-Ⅱ文件管理功能

船用光电取证实时跟踪技术的研究

在对常用的运动目标检测原理和实现算法的研究分析基础上，针对船用光电跟踪监视取证系统这类摄像机与目标都处于运动状态的目标跟踪问题，采用基于模板匹配的相关跟踪算法实现对

学位

目标跟踪模板匹配数字图像处理运动目标检测跟踪算法船用光电跟踪

三维头发建模及造型

随着计算机应用的普及，虚拟现实技术的应用越来越广泛，要求也越来越高。作为虚拟现实技术的一部分，头发的建模和造型在虚拟人体模型、游戏以及电影特性中的应用也非常广泛。虚拟

学位

虚拟现实三维头发建模粒子系统

面向EPA现场设备的嵌入式Linux驱动软件开发

随着嵌入式系统的广泛应用和飞速发展，作为自由软件的Linux操作系统出于其对多平台的支持、强大的网络支持功能以及开放源代码，无需版税和许可费用等突出的优势，成为嵌入式领域

学位

嵌入式Linux设备驱动程序软件开发

基于PC Based PLC的油井工况数据采集系统的研究

基于PC_Based PLC的油井工况远程数据采集系统由下位机数据采集、GPRS网络传输和上位机数据接收三部分组成。采集部分位于油井工作现场,由PC架构的可编程控制器ADAM-5510M(E)

学位

功图PC_Based PLCGPRSWinSockADAM-5510

光纤通道磁盘阵列及其自适应延迟策略的研究与实现

随着信息技术的飞速发展,存储系统在整个计算机系统中的地位日益突出,而存储“瓶颈”问题却日益严峻。为了缓解这种状况,在设计实现磁盘阵列时,外部通道采用具有高性能、连接

学位

磁盘阵列光纤通道自适应延迟调度

入侵检测系统中误用检测技术的研究

由于网络规模的不断扩大和新的入侵手段的不断涌现，目前企业级网络应用已经发展到现在的大规模、分布式、GB流量的网络环境，基于模式匹配的入侵检测技术和单一的入侵检测体系结

学位

入侵检测系统误用检测技术模式匹配字符串匹配算法BMH算法RF算法

基于内容的音乐信息检索技术研究

其他学术论文