基于深度学习的歌词文本配图

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:liyan2006
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
歌曲是人们用来抒发情感、表达态度的一种重要手段。传统意义上讲,音乐是一门听觉艺术。旋律的变化、音调的起伏让人们在欣赏音乐的同时可以感受到歌曲的情绪变化。随着计算机技术的发展和生活水平的提高,人们已经不单单满足于“聆听”音乐,更想“看见”音乐。因此,音乐可视化工作渐渐走入人们的视野。传统的音乐可视化工作大多基于歌曲的音频特征,利用视觉频谱显示频率和音调的变化可视化音乐的进程。然而这种通过视觉频谱的方式显得过于乏味,若能通过变换的图像表达会更加有趣和直观,对于人们深刻理解音乐也会有很大帮助。具体说来,我们发现歌曲的重要组成形式——歌词之中存在着可以用图像表征的元素,并且歌词蕴含的情感同图像情感也存在着对应的一致性。因此,我们通过歌词作为歌曲的媒介,建立歌曲和图像之间的关联完成了可视化工作。同时,对于数据驱动的深度学习技术而言,一个高质量的数据集是十分必要的。鉴于目前还没有公开的歌词配图相关的数据集,我们制作了一个带有情感标签的歌词-图像数据集,并在上面进行了大量实验,证明我们通过歌词配图以可视化音乐的方法是有效的。因此,我们工作的贡献主要包含以下几个方面:首先,我们通过歌词作为媒介建立了歌曲和图像之间的关联以实现音乐可视化;其次,我们建立了一个带有情感标签的歌词-图像数据集,并提出了利用多模态融合方式进行歌词配图的可行方法;在观察到图像和歌词之间存在着情感的对应性后,提出利用多任务学习方法辅助提高歌词配图的准确度,提高配图质量;在此基础上,考虑到歌词文本与图像之间不具备直接描述性,提出利用注意力机制增加歌词和图像关联内容的权重,使得歌词配图的准确率更高。最后根据我们的歌词图像检索模型完成了歌词配图应用的开发,利用带有时间戳的歌词信息,给出每一个歌词片段的最佳候选图像,再辅以与歌词同步的音频作为背景音乐形成音乐视频,从而达到音乐可视化的目的。
其他文献
一、公交服务民营化改制概述1.公交服务民营化改制状况二零零八年,重庆公交开始民营化,但是困难重重、举步维艰,结果出现大量的公交事故,给人民的生命财产带来极为严重的损失
众所周知,在各种运输方式中,铁路是航空业最有力的竞争对手。特别是近几年航空运输的优势已经不明显,在中短程上尤为如此。早前预期未来五年航空业的投资规模1万亿人民币,而动车
群体事件又称群体性事件,通常是指由一些利益诉求、观念主张相同或接近的个体形成的群体,通过没有合法依据的规模性聚集,采取静坐、集会、游行等方式向党政机关施压来主张权益和
彩棉服装的设计相对于传统服装设计而言,更重要的在于观念的改变,它要求设计师在装扮人的生活环境的同时考虑到人类的生存环境。彩棉服装的设计要充分发挥彩棉的绿色、环保、健
所谓困难生,一种是指学习上暂时落后的学生,另一种是指思想上暂时落后的学生。他们大多承受着巨大的心理压力,总觉得同学们瞧不起自己,老师们不重视自己。他们仿佛是久经干旱
随着新时期我陆军部队逐步由区域防卫型向全地域机动型转变以及演训和维稳任务日益增多,军用车辆的型式多样化,备轮配备必不可少.液压翻转备轮架系统,是目前大量使用的备轮翻
文章从高职院校学生的听课特点及学习能力出发,采用分组评分制教学法以提高学生的学习积极,使学生主动地参与到课堂中来,在分组评分制教学中展现自己的优势,发挥自己的才能,