教育知识图谱构建方法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:djing331
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能以及互联网技术的高速发展,教育行业正在经历着前所未有的改革和创新,在各类的教育信息系统中已经积累了大量的教育数据。知识图谱用图结构来描述知识,通过构建知识图谱把教育领域各个分散的教育数据进行整合建立起概念实体及教学资源之间的关联关系。基于教育知识图谱能够为教育带来众多智能化应用,从而帮助教师实现精准教学,帮助学生实现自适应学习,有望实现真正的“因材施教”。教育领域的知识图谱,也称为“概念图谱”。教育中的概念实体可以定义为教育数据(教材、教辅资料、教学视频字幕及试卷等等)中的k-gram,它应该是语义和句法上正确的短语且能够代表相关学科的知识概念,如:数学中的三角函数、一元一次方程等。概念实体间同时存在多种关系,最常见的是概念实体之间的先后序学习关系、依赖关系等。教育知识图谱的构建主要涉及概念实体的抽取以及实体间关系的判别。如何通过自然语言处理等机器学习技术进行教育知识图谱的构建是当今智能教育研究中的热点和难点之一。本文的研究内容与贡献概括如下:针对概念实体抽取问题,本文结合教育数据的特点,利用领域内结构化的信息提出了概念实体抽取模型。该模型基于注意力机制融合全局的主题信息以及局部的线索词信息引导模型对概念实体进行高效地抽取。此外,为了更好地利用局部的线索词信息,针对线索词种类繁多,难以搜集完备的线索词且不具有泛化性的问题,本文预训练一个软匹配模块以提高线索词的泛化能力。本文在三个数据集上进行了丰富的实验,证明了概念实体抽取模型的高效性和有效性。特别是在标注数据量较少的情况下,抽取效果大幅领先基线模型,极大地减少了对标注数据量的依赖。针对实体间关系抽取问题,本文重点研究概念实体间的两种关系:先后序学习关系和依存关系。在概念实体识别的基础上结合外部知识库(百度百科)提出了判别概念实体间关系的基本特征,然后利用机器学习算法实现实体间关系的高效判别。在真实数据集上的相关实验结果证明了所构建特征的有效性及分类模型的可靠性。
其他文献
在提出可持续性的战略方针之后,国家开始对环保工程提高思想重视。相关单位需要明确今后的发展趋势,就污水处理进行合理规范,在具体的技术手段上进行有效革新,并完善处理举措,从而全面提高污水处理的综合实施效能。下面,主要从生物处理、声波能处理、光催化等层面出发就具体的技术工艺进行合理优化,并从具体实施处理工作的设计工艺和污水处理系统运行等方面探索科学的处理举措。
<正> 硝酸还原酶(以下简称NR)是农作物利用氮素过程中的一个关键酶。NR的测定方法目前有体外法和体内法两种,体外法测定数据比较精确、稳定,但操作手续较繁杂,要求条件也较高,需在冰库中操作,否则酶易失活。这就给更多的基层科研工作者对NR进行深入广泛的研究带来了困难。因此,七十年代以来,体内法测定逐渐引起了重视,并经过一定的验证。这个方法的优点是简便快速,无需贵重仪器设备,较适宜于大田作物的测定,缺
期刊
当前信息技术的爆裂式发展为会计行业带来了日新月异的变化,与此同时大型集团企业业务模式的多样化、业务规模的扩大化、组织层级的复杂化使财务管控的难度越来越大。在此背景下,为应对上述问题我国很多大型集团企业都已经开始实施数字化转型。本文以C集团公司为研究对象,深入分析当前环境下企业财务工作面临的机遇及存在的主要问题,并分析C公司加快财务数字化转型,推进业财融合,促进效能提升,开展投入产出评价分析,推动市
近年来,随着科学技术的发展与生活水平的提高,人们在日常生活中每时每刻都需要获取和产出大量数字、图像、视频等数据。其中,图像数据凭借其直观易懂、表达信息丰富等特点成为当今社会最受欢迎的表达方式之一。因此,针对图像信息的各种处理技术成为了人类生活中必不可少的一部分,作为图像处理过程中的重要一环,图像分割技术也随之应运而生。其中,水平集方法因为其灵活性强、有强大的数学理论支撑、易拓展等优势广泛应用于各类
随着经济大环境的不断变化和财务丑闻的出现,加之国有电信行业的持续改革和不断竞争,DX公司面临的各种风险日益多样复杂,财务风险管控越来越受到重视。DX电信运营面临着诸如行业竞争、法律监管、市场运营等外部风险和财务漏洞、技术开发、决策失误等内部风险。为了谋求企业长足发展,减小财务风险发生的可能性和损失,各电信公司积极加强财务风险管理,围绕财务风险管控深入推进转型,积极发展与改进财务风险管理办法,以提供
为解决高超声速滑翔飞行器(HGV)机动飞行过程中的跟踪问题,提出了一种基于机动观测器补偿的鲁棒扩展卡尔曼滤波方法。针对传统卡尔曼滤波器由于模型误差而无法稳定跟踪的问题,首先建立了HGV动力学模型和天基红外测量模型;随后,设计机动观测器对未知气动加速度进行在线估计;在此基础上,利用机动估计对扩展卡尔曼滤波中的预测步骤进行修正,克服了因模型误差而导致的滤波发散问题;最后,考虑到机动观测器的时延误差,在
2021年7月,世界最大的碳市场——中国全国碳排放权交易市场上线交易,地方试点与全国碳市场并行,这标志着我国在碳市场建设方面取得了巨大突破。目前,我国碳配额市场运行良好,广州、北京等碳交易所已推出碳金融衍生产品。然而,与发达国家相比,我国碳市场建设起步较晚,期权、期货等碳远期产品实践少,碳市场配额价格差距较大,碳金融产品缺乏合理定价,未来仍需从丰富交易产品种类、交易者结构、完善碳定价机制等方面进一
对12个不同品种桑椹汁的抗氧化性及其与花色苷含量的相关性进行了分析。结果表明,12个供试品种桑椹汁的花色苷含量和清除DPPH自由基、羟自由基能力的变幅差异较大。桑椹汁的花色苷含量与清除DPPH自由基能力、清除羟自由基能力和铁离子还原能力分别呈显著正相关(p<0.01),与花色苷含量之间的相关系数分别为0.94,0.96和0.93,表明桑椹汁的抗氧化作用与花色苷的含量密切相关。12种桑椹汁按系统聚类
“十四五”时期是我国实现第二个百年奋斗目标的关键时期,将面临诸多新挑战和新问题,亟须财政在供给公共品和治理外部性、调控经济波动、调节收入分配等方面发挥重要功能。政府债务是公共财政三类工具之一,对于调控经济波动、稳定经济增长至关重要。当前,我国政府债务制度仍然存在一些问题,主要表现在未能充分发挥管理公共风险的作用、单一债务融资工具难以满足实际需求、财政政策地方化造成债务分布不均衡、国债调控体系不完备
为了最大程度保留有价值信息,提升企业对物料采购价格需求挖掘能力,降低挖掘误差,提出基于循环神经网络的物料采购需求智能化挖掘方法。利用小波分析方法预处理初始需求序列,多尺度分解初始序列,获取若干高、低频序列;利用相空间重构多尺度序列高、低频序列,将重构序列引入循环神经网络模型;经模型训练重构数据后,构建物料采购需求智能化挖掘模型,实现物料采购需求智能化挖掘。试验结果表明,该方法能够有效保留初始序列中