【摘 要】
:
随着社会不断地进步发展,健康饮食已经成为了人民日常生活的关注的重点。并且随着互联网技术的发展,人们虽然可以越来越方便的获取食谱相关的信息,但是在没有经过机器“大脑”的思考之后,只是经过简单聚合的、杂乱无章的数据输出问题的答案,已经无法满足人们对信息的精准性需求,进而,人们期待通过智能问答系统这种方式来更方便、快捷的方式获取健康饮食方面的信息。因此本文基于食谱知识图谱的问答系统,就是将食谱知识图谱作
论文部分内容阅读
随着社会不断地进步发展,健康饮食已经成为了人民日常生活的关注的重点。并且随着互联网技术的发展,人们虽然可以越来越方便的获取食谱相关的信息,但是在没有经过机器“大脑”的思考之后,只是经过简单聚合的、杂乱无章的数据输出问题的答案,已经无法满足人们对信息的精准性需求,进而,人们期待通过智能问答系统这种方式来更方便、快捷的方式获取健康饮食方面的信息。因此本文基于食谱知识图谱的问答系统,就是将食谱知识图谱作为食谱问答系统的“大脑”,让机器变得更加“有文化”,在经过“大脑”的思考之后给出的具有语义理解智能话程度高、准确性高、可释性强的答案。经过分析发现,目前主流的知识图谱很难对健康饮食这种特定的领域的智能问答系统提供有效的知识辅助,并且特别是在中文健康饮食领域的健康饮食问答系统方面的研究非常少。因此,针对上述问题,本文进行了大胆的尝试,以期能够解决人们对健康饮食方面的需求。本文的主要工作包括以下三个部分:本文首先通过编写爬虫脚本,从中文美食相关的网站中,爬取了大量的食谱、食材、食谱和食材的医疗功效以及食谱和食材适宜的人群等数据,然后为了进一步丰富食谱中相关的数据,本文根据爬取的食材数据通过维基百科获取到了食材的营养价值、科学分类以及食材的描述等重要数据。最终获得了大量的、完整度高、覆盖范围广的与中文健康饮食相关的数据,填补了中文食谱领域暂无健康饮食相关数据的空白。本文利用基于规则的方法和基于依存句法分析的方法,从半结构化和非结构化的数据中,抽取了大量的与健康饮食相关的食谱先验知识。本文通过对食谱数据进行预处理之后抽取了食谱领域相关的概念和术语以及关系,最终利用Protégé本体编辑器工具生成了中文食谱领域的本体。并在本文设计的食谱领域本体的指导下,创造性的构建了一套全新的与健康饮食相关的食谱知识图谱,并采取了一定的手段将食谱知识图谱存储于Neo4j图数据库中,解决了传统知识图谱无法为食谱领域问答任务提供有效的先验知识的问题。最后,为了将食谱知识图谱应用在问答任务中。在充分考虑了食谱数据中食谱、食材、人群、功效等数据之间关系复杂性的情况下,为食谱问答任务设计了简单任务和复杂任务两种难度的问答任务,并采用了基于合成的方法生成了高质量的问答对,构建了用于食谱问答任务的数据集。最后,提出了一个基于图卷积网络和预训练模型的适用于食谱知识图谱问答任务的模型,并经过试验分析,证明了本文设计的模型比其他模型可以更有效的利用先验知识,去完成问答任务。也说明了本文构建的食谱知识图谱可以为食谱问答任务提供有效的支撑。
其他文献
非正交多址接入(NOMA)技术可以利用相同的传输资源(时间,频谱和空间等)同时为多个用户提供服务,因此它可以实现比传统正交多址(OMA)技术更高的频谱效率和更大的系统容量,目前已被广泛认为是未来无线电接入网络的关键解决方案。传统的NOMA系统通常将OFDM作为多载波方案,但这种方案存在高峰值平均功率比以及采用循环前缀降低了频谱效率这两大缺陷。为解决这些问题,小波调制被引入NOMA系统中,但基于小波
在信息时代,随着网络用户及网络需求的飞速增长,数据中心业务海量增长,网络一旦发生故障将会导致不可估量的业务损失,中断时间越长,损失越严重,因此,数据中心网络连接故障的快速恢复技术成为研究热点。现有基于SDN架构下链路故障恢复技术都需要控制信号来驱动SDN交换机恢复故障,需要至少两次南向接口通信,使得系统发现和恢复链路故障时间过长。而基于数据信号驱动系统恢复链路故障的方法,节省了南向接口通信时间。现
科技的进步离不开高精度工具、仪器的配合,部分器件在制造时可能存在制作不达标的问题,或有的设备在使用一段时间后出现磨损、变形,为能够更好更安全的使用这些设备需要对其进行测量。线结构光三维测量技术有着非接触、精度高等优点,在各领域有着广泛应用,因此对线结构光测量技术的研究也尤为重要。目前线结构光三维测量的扫描方式在测量不便移动的物体内壁时有一定局限性,本文提出自旋转式线结构光三维测量系统,可以通过对线
由于有机发光二极管的科研价值和经济效益逐步上升,电流-电压关系作为描述有机发光二极管电学性质的一个非常重要的物理因素,对其进行深入研究也显然是必要的。所以本文对有机发光二极管的电流-电压关系进行了研究。本文的主要内容为:介绍了与有机发光二极管电流-电压相关的理论基础,如漂移扩散方程、漂移电流、扩散电流、玻耳兹曼统计、费米统计、爱因斯坦关系等。在漂移扩散方程的基础上,对有机发光二极管电流-电压公式进
自然界和工程领域的流动大多处于湍流状态,而湍流带来的高摩擦阻力一直是困扰人们的难题,研究湍流减阻对于减少能源消耗、环境保护等意义重大。利用柔性覆层进行湍流减阻的研究起源于人们对于海豚表皮的仿生研究。相比于主动控制,虽然减阻的效果差一点,但柔性覆层减阻不需要能量的额外输入,亦不用考虑安装传感器等目前技术条件下很难实现的问题,因而受到了人们的重视。目前柔性覆层延缓流动转捩的作用已接近应用阶段,但其对充
自然语言处理(Natural Language Process,NLP)是计算机科学和语言学的交叉,是人工智能领域的一个重要分支。近几年来随着计算机运算能力的提高,自然语言处理技术发挥了越来越重要的作用,来帮助解决人们实际生产生活领域中遇到的各方面问题。中文自然语言处理是NLP领域的重要组成部分,随着我国综合国力的不断增强、国际地位的不断提升,汉语也越来越作为一门流行而普及的语言受到世界的关注。中
随着移动成像技术以及高性能计算技术的飞速发展,在各种环境中进行即时图像采集和处理成为了现实。近年来,移动平台上陆续出现的实时将文本翻译成其他语言的这类应用,进一步激发了人们对这类问题的兴趣,这使得关于图像和视频中的文本检测与识别的研究课题越来越受到关注。深度学习神经网络推开了自然场景文本检测与识别快速发展的大门,目前大多数文本检测与识别模型都是基于深度学习进行特征取以及后续的文本区域分割及字符识别
目的hURAT1是维持血尿酸水平的关键离子通道,是导致原发性高尿酸血症的重要侯选基因。根据前期工作基础,第三内含子+11 G>A SNP与原发性高尿酸血症遗传易感性密切相关。本研究拟进一步开展体外功能研究,探讨该点SNP是否通过影响hURAT1基因mRNA的可变剪接而改变hURAT1蛋白结构,近而增强肾近端小管对尿酸的重吸收,导致肾脏对尿酸的排泄减少以及高尿酸血症。方法提取正常人全血基因组DNA,
精神分裂症(Schizophrenia,SCZ)是一种慢性、持续的重大精神疾病,它在临床症状上表现各异,包括幻觉,妄想,行为异常,认知障碍和其他可变模式。精神分裂症病因病理至今尚未明确,分别有研究认为精神分裂症会影响大脑胼胝体结构和大脑功能交流。胼胝体(corpus callosum,CC)位于左右脑半球之间,是脑内主要的白质纤维束,起着整合两侧半球功能活动的重要作用。大脑功能连接是利用功能性核磁