论文部分内容阅读
音乐在人类的日常生活中一直占据着重要地位,随着社会的发展,对音乐的需求也越来越多。传统的音乐创作方式周期漫长,并且需要创作者具备专业的音乐知识,因此,利用计算机智能生成音乐成为了现在研究的热点。虽然使用深度学习避免了手工构建特征的消耗,但现有的音乐生成算法还有很多不足之处。比如没有考虑到训练阶段和生成阶段之间的差异,这种差异会使误差增大,从而影响生成音乐的质量。未充分考虑到真实的音乐创作过程,只是让网络从音乐数据中学习音符之间的依赖关系,这样生成的音乐并不能保证其和谐性。因此,本文针对上述问题,为了得到更高质量、更具艺术审美的音乐,针对音乐智能生成进行研究。本文的主要内容和贡献有以下几个方面:1.为了完成音乐生成任务,本文基于长短期记忆网络(Long Short-Term Memory,LSTM)构建了字符级的音乐生成模型Melody_LSTM。将音乐转化成音符序列的形式进行处理,并使用编码技术将音符序列转化成音符向量的形式输入神经网络。通过将下一时刻将要输入的音符序列当作目标值,构成一个监督学习的训练过程,使Melody_LSTM网络可以学到时间尺度上音符之间的依赖关系。经过生成实验,证明了Melody_LSTM网络能够从音乐数据中学到音符之间的依赖关系,并且能够完成端到端的音乐生成任务。2.针对现有音乐生成模型中存在的问题,为了让模型能够考虑到和弦进行和乐理规则对音符选择的影响,本文在Melody_LSTM网络的基础上构建了基于深度强化学习Actor-Critic算法的音乐生成模型(Actor-Critic based Music Generation,ACMG)。模型引入了一个Critic网络,该网络由本文构建的和弦进行奖励机制、乐理规则奖励机制和状态价值奖励机制构成。Critic网络能够评估当前时刻生成音符的价值,音乐生成网络根据其价值进一步更新自身的生成策略,这形成了一个更接近生成阶段的训练过程,并允许优化特定的音乐风格,最后通过对比实验证明了ACMG模型的有效性。3.为了得到高质量的音乐,本文在现有开源音乐数据库Lakh MIDI和NSynth的基础上,利用深度学习技术构建了一个干净、规整的人工模拟音乐数据库(Artificial Simulation Music Database,ASMD),并进行不同数据库之间的对比实验,证明了该数据库对深度模型的训练有积极作用。