论文部分内容阅读
诗歌和对联是中华语言的独特艺术形式,语义上内容丰富,韵律上平仄有序,朗诵起来具有很强的美感,备受人们喜爱。在自然语言处理领域,诗歌和对联的自动生成是一项极具挑战性的工作。实现诗歌和对联的自动生成,对弘扬中华传统文化有着深远的意义。本文基于神经网络和多任务学习技术对诗歌与对联自动生成进行研究,主要工作如下:一、针对计算机写诗普遍存在主题不明确、诗的内容与写作意图不一致的问题,本文借鉴基于规划的诗歌自动生成方法,效仿诗人先联想再写诗的过程,提出一种基于序列到序列模型的诗歌生成方法。方法将诗歌生成分为两个阶段。第一阶段根据用户意图构建大纲,采用一种基于注意力机制的关键词扩展模型用于大纲的生成。第二阶段根据大纲生成诗歌,采用一种具有双编码器和注意力机制的序列到序列生成模型融合大纲信息生成诗歌。实验表明,与基准方法相比,所提方法生成的诗歌,主题意义更加明确,诗所表现的内容和写作意图更加一致。二、在中国传统文学中,诗歌和对联有诸多相似特征,且两者的自动生成方法大致相同。针对这一现象,本文提出了一种基于多任务学习的诗歌与对联自动生成方法,在之前诗歌生成方法基础上联合对联生成。方法同样先根据用户意图构建大纲,然后在生成阶段,采用一种新颖的多任务学习模型生成诗歌与对联。采用的多任务学习模型通过编码器参数共享,解码器参数不共享,让模型底层编码部分兼容诗歌和对联特征,解码部分保留各自特征。实验表明,与基准方法相比,多任务学习模型泛化能力更强,表现效果优于单任务模型。本文的主要创新点:(1)在基于规划的诗歌生成方法基础上,设计了一种基于注意力机制的词扩展模型用于主题词扩展,使诗歌主题意义更加明确,内容与意图更加一致;(2)首次将多任务学习应用到诗歌和对联自动生成中,设计了一种新颖的多任务学习模型生成诗歌与对联,增强模型泛化能力,提高表现效果;(3)首次在对联生成中引入用户意图,生成个性化对联。