基于实体关系的NL2SQL语法结构构建

来源 :山东工商学院 | 被引量 : 0次 | 上传用户:jake9
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然语言转结构化查询语言(Nature Language To Structured Query Language,NL2SQL)是自然语言接口领域的热点问题之一。当前,由于含嵌套查询SQL语法结构难构建,这一领域研究多针对不含嵌套的简单语句,对于含嵌套子句的复杂查询,处理过程并不理想。然而在日常生活中,含有语义嵌套的查询普遍存在,因此,嵌套查询的SQL语法结构构建,对于NL2SQL技术的工程化具有重要意义。针对NL2SQL任务中,含嵌套查询SQL语法结构构建的问题,本文展开相关研究,并提出相关解决方案。本文一方面基于实体关系的思想,对嵌套查询SQL语法结构进行表示,将语法解析问题转为关系抽取问题;另一方面针对实体关系判定问题,提出基于Bi-LSTM(Bidirectional Long Short-Term Memory)网络的关系抽取模型,同时设计基于SQL语法的关系修正算法,以提升SQL语法结构的准确率。本文主要研究工作包括:(1)针对直接解析嵌套SQL语法结构较困难的问题,提出基于实体关系的SQL语法结构表示方法。设计3类实体间无向连接关系表示SQL语法结构,借助关系抽取算法预测实体关系以构建SQL语法结构,避免直接解析的困难,提升预测准确率。每条查询语句可构建多个关系抽取样本,降低了数据采集和标注成本。(2)针对查询语句中实体关系预测问题,提出基于Bi-LSTM网络的关系抽取模型。模型输入查询语句和数据表的特征表示,采用结合注意力机制的Bi-LSTM网络捕捉双向关键语义信息。实验结果表明,该模型针对嵌套查询中的实体关系抽取效果良好。(3)针对查询语句中词汇表达的多义性问题,提出基于权重的列名向量化表示方法。以列名常用词向量加权平均替代常规列名表示,相比较常规列名向量表示方式,基于权重的列名向量化方法在查准率、查全率和F1值等指标上,有着更高的性能表现。(4)提出基于SQL语法的关系修正算法。在关系连接定义和SQL语法结构的基础上,构造2种语义约束,将查询语句中不同的实体关系进行综合分析,修正部分预测错误的实体关系。实验分析表明,修正算法处理后,针对多条件含嵌套语句,语法结构预测准确率提升了1.3%。
其他文献
随着1995年“中国教育和科研计算机网(CERNET)示范工程“建设完成,率先为我国高校师生提供先进的互联网服务于国际化教育资源服务[1],高校开始逐渐注重本校网页建设。高校网页
【正】职业教育不同于普通教育,职业中学的教育教学目标是为社会培养大量的初级、中级技术人才,绝大部分学生毕业后将直接步入社会从事社会实践工作。所以,学生主要以学习专
据报导,世界上出现了声势浩大的"企业再造"运动,20世纪中期,美国已有75~80%的大公司进行了再造,并取得了巨大的成功.这种全球"企业再造"的浪潮,也影响着中国的企业,海尔等先行
素质教育面向全体学生,促进学生的全面发展。在素质教育理念下,德育的发展显得尤为重要,对培养大学生的人生观、世界观、价值观具有重要意义,体育课程的思想政治教育对培养大
体育运动中的人格美,主要指从事体育运动的有关人的思想品质、道德情操、行为态度、理想趣味等所体现的人的价值美.美的人格是人的心灵的真、善、美的结合,是心灵美之见于行
期刊
<正>一、中学生对环境化学知识的需求分析为了提高中学生的环境保护意识和科学探究能力,连续几年我都组织全区学生参与环境化学知识方面的学习,并通过开展清洁空气挑战的知识
会议
为评价球敌对鸡柔嫩艾美耳球虫秦皇岛株的效力,选择68只海兰褐公雏随机分成阳性对照组,阴性对照组,球敌1组(0.2mL/L水)和球敌2组(0.4mL/L水),每组17只鸡.在14日龄,除阴性对照
<正>市场经济体制在我国的建立和完善,使得企业管理发生了巨大的变化,投资活动日益增多,投资领域日趋宽广。企业对外投资已成为企业活动的重要内容。企业对外投资就是企业在
会议
在当前我国高等教育快速发展和高等教育国际化不断推进的大背景下,大学生需求不断地向个性化、多样化、复杂化等方向发展,高校学生事务管理工作也面临着许多不同的新情况和新