上下文相关的词表示及其领域迁移研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:qimao1986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会信息化高速发展,每天都会有包含丰富的知识和信息的大量文本数据产生。使用计算机和自然语言处理技术进行自动的语言分析和文本处理,推动着人类生产生活的高速发展。然而,要进行自然语言处理就必须将语言的基本成分转化为计算机可以识别的数学表示。上下文相关的词表示方法的提出解决了传统预训练静态词向量表示无法解决的“一词多义”问题,能够刻画词语在不同语境下的表义变化和其中复杂的语法、语义信息。与传统预训练词向量的方法不同,上下文相关词表示方法的预训练结果为句子语义表示模型,并在应用于下游任务时使用预训练模型参数对样本句的各个词语进行深度语义融合。使句法分析、语义角色标注、自动问答、文本蕴含、阅读理解等多种任务效果得到了显著的提升。中文分词是中文信息处理重要的基础任务,前人的方法基本都基于词向量表示进行建模,难以克服上述诸多弊端。本文从中文分词问题出发,利用上下文相关词表示的预训练模型构造了分词模型,并在多个中文分词数据集中进行了实验。得益于上下文词表示预训练模型深度语义融合带来的强大泛化性,我们的模型相较传统模型在分词性能上得到了显著地提升。模型领域迁移问题也是我们的研究的重点,由于自然语言的领域歧义性特点,通用语料训练的模型在专业领域上存在性能严重下降的问题。而专业领域数据往往难以获得。如果可以将通用领域知识或模型更好的迁移至专业领域应用,便能够解决以上问题。我们对上下文相关表示构建的分词模型进行了领域迁移实验,并在不同迁移数据集规模上与传统分词模型进行了详细的对比。结果表明,基于深层上下文表示的分词模型在跨领域泛化能力、迁移能力上都远高于传统模型,并且能够在数据量更少的情况下更稳定地进行高效迁移。这种深度上下文表示模型是基于无标注语料构造的,难以与其它有效特征进行深度融合,简单的隐层拼接往往无法带来很好的效果。而且,由于其模型构造复杂,存在内存和计算资源占用过多,预测速度慢等问题。本文使用多任务学习来解决这一问题。一方面,我们使用多任务联合学习对上下文相关表示模型增加特征知识,这使得特征知识相互迁移融合,相比独立训练与简单特征拼接模型达到了更优秀的性能;另一方面,多任务模型由于共享了表示模型和隐层计算,从而大大加快了多任务文本分析效率。
其他文献
为了减轻或解除分娩过程中的疼痛,我院采用了水针疗法皮内注射,它能安全有效地达到分娩镇痛的目的,现报道如下.1对象与方法1.1研究对象自1998年1月至2001年1月选择住院拟阴道
生物玻璃是一类再生医学用生物材料,它的发明开创了生物活性无机材料领域。生物玻璃在体液环境下可以促进类骨磷灰石的沉积,还可以刺激多种有利的细胞行为。自从上个世纪七十
综述了国内外有机硅压敏胶的研究开发现状,着重分析了溶剂型、高固含量型、非芳香族溶剂型和无溶剂型有机硅压敏胶的特点和组成与性能的关系,并对有机硅的应用前景作了展望。
燃气自动焊接机是空调换热器生产过程中的一种专用焊接设备。本文主要针对空调换热器生产人工焊接中生产效率低、环境差以及部分焊点焊接质量较差等问题进行研究,使用自动燃气焊接技术(包括机械控制和燃气控制)设计一种新型的燃气自动焊接机。根据焊接产品的结构特点,从连续生产、焊炬装置的调整、护栏自动调整和检测功能以及气体稳定控制等五个方面,对该机进行了细致的分析。此外,还对负载、速度、精度三个方面的性能需求进行
近几年我国房地产发展迅速,对于房地产企业来说,在工程管理中做好资金的控制有着重要作用,能够对房地产企业的生产经营活动产生重要的直接影响,对企业的生存活动产生着重要的
汽车产业的发展与我国经济发展是息息相关的,汽车产业的发展推动了我国经济的发展.汽车产业既是资本、技术密集型产业,又是劳动密集型产业,汽车产业具有很高的关联效应.随着
<正>据中央电视台报道,近年来,教育部门屡发新规,教育顽疾却毫无起色。相反,针对新规旧律,当前中小学教育还形成了多项潜规则。如:义务教育阶段就近入学不得选拔性考试却依然
无回答误差是非抽样误差的一个重要来源。本文对无回答对统计的影响进行了具体分析,并针对目前经常采用的控制无回答的方法误区进行了剖析。
目的初步分析温度对大连地区急性ST段抬高型心肌梗死(STEMI)患者的影响。方法选取STEMI患者817例。无发病日定义为当天无STEMI发病例数,发病日定义为当天有STEMI发病例数。当天
通过加强高校建设服务型党组织建设,充分发挥党的先进性,让青年学生自觉践行党为人民服务宗旨,培养高素质的服务社会的人才。本研究以此为出发点,通过理论和实践的研究,分析