生物医学领域的实体因果关系抽取

来源 :苏州大学 | 被引量 : 4次 | 上传用户:hhttllzzwei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着生物医学实验方法的变革,相关实验数据和文献资料呈现指数级的增长,如何从规模庞大的科学文献数据中快速有效地抽取出有价值的信息,是一个亟待解决的问题。生物医学领域的实体因果关系抽取是从生物医学文献资料中自动抽取实体之间的因果关系以及与实体相关联的功能。本文对生物医学领域实体之间的因果关系抽取展开研究,研究内容主要包括:(1)基于词对齐的实例级因果关系抽取语料构建。原始的实体因果关系训练语料是基于句子级标注的,不能直接用于传统的机器学习方法。本文在构建关系语句和文本句子平行语料的基础上,通过词对齐技术自动构建一个实例级的层次序列化标注语料,为利用机器学习方法抽取实体因果关系打下基础。(2)基于层次序列化标注的因果关系抽取。基于已构建的实例级训练语料,利用条件随机场训练层次序列化标注模型,然后再利用训练出的模型对多层次的因果关系进行抽取。实验结果表明,基于条件随机场的层次序列化模型,能够在因果关系抽取任务上取得较好的效果。(3)基于序列标注和二元分类混合模型的因果关系抽取。考虑到关系层面的模式较为复杂,序列化标注模型并不能很好地学习到该层面的模式,本文提出一种序列化标注与分类模型相结合的模型,即采用序列化标注模型识别功能,再利用分类模型识别关系。实验结果表明,基于序列标注和二元分类混合模型的因果关系抽取方法可以取得更好的结果。
其他文献
旧世界的鼻叶蝙蝠(Hipposideridae)是一个蝙蝠族,使用复杂的挡板形状的鼻叶去衍射他们鼻叶向外发出的波包。蝙蝠可以改变它们鼻叶的形状通过肌肉的运动。在相近的马蹄形蝙蝠
双语实体在跨语言信息检索、机器翻译等领域有着非常重要的应用。由于缅甸语为资源稀缺语言,汉-缅双语语料库构建面临着很多困难。本文研究缅甸语语言特点、汉-缅双语可比语
太阳活动与日常生活息息相关,尤其是生活中的各种电子设备更容易受到太阳活动的影响。为了减小损失需要对太阳活动进行实时观测,及时发出预警。但是由于大气湍流的干扰,通过
由于动态随机存取存储器(Dynamic Random Access Memory,DRAM)的可扩展性变得越来越差,逐渐接近极限,其已经不能满足高性能计算机主存的大容量需求。相变存储器(Phase Change
近年来,党和政府优先对民族地区进行“弱势补偿”,公共教育资源更多向民族地区倾斜,各项教育民生工程也正在如火如荼地开展。伴随着各项帮扶性、倾斜性以及精准脱贫政策的大
随着信息技术的飞速发展,多处理机系统被广泛地应用在高性能计算领域。然而随着系统中处理机数目的逐步增大,系统发生故障的概率也随之增长。当系统发生故障后,迫切需要一种
随着智能化时代的到来,计算机数据管理正逐步由手工化向智能化转变,个人信息的智能管理也成为了热门的研究领域。如何高效管理日益增多的个人文档,提高工作效率,是数据分析与
在我们的日常生活场景中存在着大量的平面,而平面凭借其自身特殊的结构特征,在计算机视觉领域发挥着越来越重要的作用。自动提取出复杂场景中的各个平面,在图像配准、相机标
计算机公共课教学模式改革已经在我国各大高校全面铺开。以提升教学学习质量为目的,各院校逐步改进自身相关教学体系,力求获取更高的教学质量。昌吉学院积极响应这一趋势,分
近年来,3D视频成为人们日常生活中不可或缺的一部分。AVS工作组(数字音视频编解码技术标准工作组)于2014年完成3D-AVS2标准。3D-AVS2视频编码标准采用纹理图加深度图的编码方