【摘 要】
:
在大数据时代,文本知识的抽取、理解显得愈发重要。中文词汇本身具有多样性和歧义性,因此如何正确理解文本,获取准确的语言信息是目前自然语言处理领域研究热点之一。本文研究的实体链接算法是识别给定文本中的实体指称,并将实体指称链接到目标知识库的一个过程,它主要解决词汇一词多义和多词一义的问题,对提升文本理解能力有重大意义。本文在分析实体链接算法相关技术的基础上,深入研究了候选实体生成以及实体消歧的相关技术
论文部分内容阅读
在大数据时代,文本知识的抽取、理解显得愈发重要。中文词汇本身具有多样性和歧义性,因此如何正确理解文本,获取准确的语言信息是目前自然语言处理领域研究热点之一。本文研究的实体链接算法是识别给定文本中的实体指称,并将实体指称链接到目标知识库的一个过程,它主要解决词汇一词多义和多词一义的问题,对提升文本理解能力有重大意义。本文在分析实体链接算法相关技术的基础上,深入研究了候选实体生成以及实体消歧的相关技术,并对传统实体链接算法进行改进,给出具有创新性和实用性的实体链接模型,本文的主要研究内容如下所示:(1)本文构建了一种实体指称扩展算法。相比传统算法直接利用实体指称进行知识库搜索,本文提出的实体指称扩展算法能够获得尽量精准的实体指称中文表达,进而可以提高候选实体召回率。(2)本文构建了一种融合浅层语义信息的图模型过滤算法。实体指称扩展会带来候选实体过多,减小整个实体链接系统速率的问题,因此本文在此基础上构建了一种候选实体过滤算法。相对于传统算法利用单一特征进行过滤导致候选实体召回率过低,本文提出的候选实体过滤算法在保证候选实体召回率的同时,能尽量减少无关候选实体,提高系统效率。(3)本文构建了基于细粒度实体分类模型的实体消歧模型。相较于传统实体消歧模型直接预测消歧实体造成模型过拟合,本文将实体消歧问题转化为实体分类问题;同时改进了传统的建模方式,将融合位置信息的Attention机制嵌入记忆效果更好的记忆网络中,获取实体指称的深层语义表达,其次利用候选实体的细粒度类别进行实体消歧,通过实验证明,本文提出的实体消歧算法在精确度上有明显提升。(4)针对中文语料库缺乏的问题,本文首先对中文维基百科数据进行了相应的预处理,为后续实体链接算法打下数据基础,最后通过搭建一个实体链接算法的展示和应用系统,使用自顶向下的设计方式,展现中文问答和实体链接的相关算法流程,证明本文算法的实用性和可扩展性。
其他文献
摘要:多样化的运动锻炼措施为手段能够促进学生积极参与体育锻炼。本文运用文献资料法和查阅书籍的方法对体育锻炼促进学生心理健康,针对出现的不良情绪等问题采取的应对方法以及怎样促进学生参与体育锻炼并有目标有计划地进行锻炼而采取的措施的相关问题展开分析和研讨。 关键词:体育锻炼;学生;心理健康;方法;成效 学生正处于生理成熟与心理不成熟的不稳定阶段,遇事容易冲动,急躁,再加上现如今社会形势及压力越来越
一、音乐欣赏教学的特点 音乐欣赏教学是以具体的音乐作品为对象,以欣赏者--学生的聆听为主要手段,以分析乐曲的有关音乐资料及认识作曲家的创作背景为辅助手段,进而达到领
摘要:当前足球运动已经成为一种全球化的体育活动,学生在足球训练中不仅可以提高自身身体素质,同时对提高团队合作意识和协作能力也有重要作用。从本质上来讲,足球训练对于学生的足球意识有着较高的要求,只有学生具备较强的足球意识才能顺利地完成足球训练,积极参与足球运动,因此在实际的教学中高校教師一定要重视起来,积极采取有效的教学措施培养学生的足球意识,这样才能更好的提高足球教学质量。对此本文重点介绍了培养学
生物学是一门实验性和应用性很强的学科,是中学理科教育教学的一门重要基础学科,而生物学实验则是生物学教学的重要环节。实验课质量的好坏,直接关系到学生的学习质量和兴趣。生物学有一套独特的实验方法和技术,学习和掌握这些基本方法和基本技能,不仅可以加深学生对生物学基本理论的理解,加强对生物的感性认识,而且能够给他们将来深入学习生物科学知识,乃至进行生物科学研究打下良好的基础。为了充分调动学生的学习主动性,
体育教学模式是指在一定的体育教学理论指导下,围绕体育教学目标所形成的相对稳定的教学程序及其实施的简要描述,而教学理念则是人在教学过程中所形成的一种意识反映,它是抽象的多变性的随着素质教育的不断深入,体育课堂教学模式正在发生根本性的改变:由传统式的教学向开放式的教学转变;由死板的教练式向民主实践式过渡转变传统的教学观念,提升教学理念,充分发挥学生的主体作用,重视学生主动参与,突出学生创新精神和实践能