基于隐变量的文本生成模型研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:jtfcyy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本生成旨在自动生成或抽取合乎规范的、符合语言规则的文本,是自然语言处理领域的一大挑战。自然语言处理技术往往属于认知领域的探索,并且语言的理解通常需要上下文相关的场景或者大量的先验知识作为参考。随着语言模型的发展,文本生成模型常被建模成序列到序列的Encoder-Decoder模型。文本生成模型主要分为生成式模型和抽取式模型,典型的文本生成模型往往离不开最大似然估计方法的范式,根据前序生成的文本预测当前时刻的文本。然而,大多数的生成模型忽略了无法观测或者缺失的数据的影响,即忽略了隐变量的重要性。基于对隐变量模型的探索,本文分别对生成式和抽取式的文本生成模型进行研究,主要研究内容如下:(1)对于生成式模型,本文通过对生成对抗网络的研究对文本生成模型形式化建模,提出一种Encoder-Decoder-Discriminator的文本生成模型架构。并且通过对变分自编码器模型的研究,提出了基于隐变量的文本生成模型LatentGAN模型。该模型首先通过引入隐变量和近似后验分布的假设,获取文本的潜在特征分布,解决生成对抗网络多样性不足的问题。其次通过引入对抗式地训练,缓解变分自编码器生成文本质量不高的问题。本文设计并实现了LatentGAN模型,生成器模型采取长短期记忆网络架构;判别器模型采取卷积神经网络进行二分类判断。并且引入强化学习定义奖励函数的思想,定义生成器的损失函数。并基于中文诗词数据集进行实验,实验证明了该模型相比于其他方法的有效性。(2)对于抽取式模型,本文将自然语言处理的关系抽取任务建模成基于隐变量(关系)的抽取式文本生成模型,提出一种基于张量分解的关系抽取方法TDRE模型。该模型将抽取的三元组建模成张量的形式,能够处理实体关系抽取中的多标签关系实体对,解决关系标签的重叠问题。并且本文提出基于DEDICOM张量分解的关系抽取模型,该模型在关系维度上对抽取模型进行分解能够辅助获取关系与关系之间的内在联系。本文采用条件随机场模型进行实体识别,双向长短期记忆网络进行关系分类,DEDICOM分解模型进行关系抽取。并基于NYT10数据集,CoNLL04数据集和ADE数据集进行实验,实验结果表明TDRE模型的结果比目前最优模型的效果更优,证明了基于关系维度的张量分解方法的有效性。
其他文献
提出一种基于统计学的插值算法,依据所要进行插值点的方向性进行搜索插值,以确定该点是平滑区域还是边缘区域,根据预先设定的阈值进行插值处理。通过仿真实验,该算法很好地解决了边缘模糊和效果不佳的问题。
基于英飞凌公司ICB1FL02G的智能集成芯片控制设计,利用串联于电源输入端的前/后沿可控硅调光器来实现灯光明暗度的调节。将调光电信号通过压控振荡器线性地转换为半桥驱动频率,
以128家农户2000--2006年的数据为样本,运用面板数据的回归模型研究了农业劳动力在农村就地转移和增加非农产业投入对农民收入增长的影响。结果发现,农业劳动力就地转移和增加