基于MIDI音乐的深度学习自动作曲研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:linkageldap
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年,音乐的发展已经呈现大众化的趋势,而人工作曲的专业性太高,无法满足人们日益增长的音乐欣赏需求。此时就需要一种能高效快速生成音乐的作曲方法,因此自动作曲方法应运而生。自动作曲方法通常可以分为音乐特征的表示和作曲模型的设计两个关键的部分,本文针对MIDI音乐文件分别从以上两个部分给出优化方案,完成自动作曲工作的研究。本文的主要研究工作和创新点如下:(1)音乐特征的提取和表示部分,本文借鉴自然语言处理对语义分析的词向量模型,提出基于上下文语义编码的音符特征向量生成方法,解决了传统自动作曲使用独热编码的形式表示音乐特征而导致无法刻画音乐特征的上下文语义信息的问题。本文生成的音符特征向量之间不再是独立正交的,可以很好地表示音乐特征的上下文语义信息,是音乐特征的表示部分的优化方案。本文通过对比实验表明,使用本文提出的音符特征向量表示音乐特征而进行自动作曲工作能有效地提高音符预测的准确率。(2)自动作曲模型的设计部分,本文提出一种基于Bi-GRU(Bi-directional Gated Recurrent Unit)网络和自注意力机制的自动作曲模型,解决了传统的自动作曲模型由于网络结构的限制难以深入学习音乐的时序信息以及灵活的依赖信息的问题。在本文的作曲模型中,Bi-GRU网络由于自身的双向性,不仅可以学习音乐的前向依赖信息,还可以学习音乐的后向依赖信息,更好地刻画了音乐的时序信息;而自注意力机制通过赋值不同权重灵活的调整音乐特征之间的依赖关系,在音符预测的过程中突出重点信息,弥补了循环神经网络在发掘依赖信息中由于短时记忆力使得发掘音符之间的联系越来越弱的局限,优化了自动作曲模型。(3)自动作曲效果评估部分,本文提出客观和主观相结合的评估方式。其中,客观评估以自动作曲模型的音符预测准确率为准则,本文提出的自动作曲方案的音符预测准确率Top1 Accuracy、Top2 Accuracy和Top3 Accuracy上分别达到81.93%、90.15%和92.62%。在主观评估中,开发一套自动作曲线上评估系统,邀请音乐爱好者根据自己主观听音感觉做出评分,感性地评估自动作曲作品的效果,两种评估方式共同保证了本文自动作曲方案产生音乐的准确性和生动性。
其他文献
在现代通信系统中,特别是在移动通信网络中,基站天线是接收和发射电磁信号的重要设备,是移动通信接入系统的重要组成部分。材料非线性是导致天线无源互调(PIM)不良的重要因数,而基站天线内部的金属连接被认为是典型的材料非线性。天线PIM的优劣会显著影响通讯系统的通讯质量。各大天线厂商目前都致力于天线内部的去金属连接研究,于是塑料铆钉在基站天线内部的使用越来越普及,而摩擦型塑料铆钉的使用存在需要点胶水二次
随着我国经济的发展和城镇化步伐的加快,各地用于地方经济建设的资金需求不断增加,然而分税制改革的实施使得地方政府财权与事权不匹配,资金缺口增大,且受相关法律的限制地方
许多研究表明,近半个世纪以来,我国主要河流的河道径流呈下降趋势,且北方河流径流量下降尤为显著。学者们通过归因分析,认为降雨量的改变是影响河道径流量变化的主要因素。然而研究也表明,近半个世纪以来我国的年降雨量变化不大,因此还需要通过更细尺度的数据分析来揭示河道径流量下降的原因。目前国内对于径流年际变化规律的研究较多,而对于年内变化规律的研究较少,对于不同径流成分的研究也缺乏系统性。为了研究我国主要流
生态补偿是一种促进人与自然之间和谐的环境保护制度,生态补偿的目标是更好的保护环境,利用经济的手段从而来调节自然与各类不同利益关系之间的人的关系。本研究以生态补偿原
众包测试是一种新兴的软件测试方法,已经引起了学术界和工业界的广泛关注。在众包测试中,测试工人帮助软件管理者执行测试并提交测试报告,在这个过程中,软件管理者需要对提交
蛋白质通过与其他蛋白质的物理相互作用在生活的各个方面发挥着关键作用。蛋白质-蛋白质相互作用(Protein-Protein Interactions,PPIs)是许多生物学过程的分子基础,如信号转
由于受到传感器自身性能的限制,在面临快速、低曝光等环境下传统相机无法采集到质量较好的原始图像,因此传统视觉算法的性能在特殊环境下会受到严重的影响。事件相机作为一种
深度学习在面部活体检测领域已取得了较为显著的成果,然而在处理遮挡、光照、角度不当、AI换脸等复杂条件下的面部图片时,因难以预测数目较多的面部特征点集合,使得活体检测
睡眠分期研究一直是研究睡眠的一个重要方向,睡眠分期有助于了解睡眠结构,分析睡眠质量。而当前睡眠问题是一个极为普遍的社会现象,人工分期不仅效率低且准确性低,睡眠自动分
作为图像处理领域最受关注的研究问题之一,数字识别技术通过对图像中的数字进行检测、分析和识别,实现数字文本的数字化,是文本识别中的一种。数字识别技术在日常生活和工业生产的很多领域都有着广泛的应用。对于传统的机器学习方法,数字识别技术通常是先在图片中获取数字所在位置,然后分割出单字符,继而将这些单字符送入字符分类器中进行识别获得识别结果。随着计算机性能的提高,深度学习技术目前获得了越来越多的关注,利用