检务公开人机交互场景下的语义理解

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:besunqz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,自然语言处理技术快速发展,在金融、医疗健康等领域,得到了越来越广泛的应用,但是在检务领域研究较少。为实现新技术与检察实务领域的深度融合,最高人民检察院提出了探索推进检务公开实施方式、打造智慧检务的目标。本文旨在探索自然语言语义理解在检务公开领域人机交互模式下的创新应用,针对现有语义理解架构中未考虑问句中的深层语义关系、过分依靠关键字匹配的弊端等问题进行改进,主要的研究工作和创新点包括以下三个方面。(1)基于BERT模型的中文分词研究。BERT模型作为一种新的语言表征模型,可以引入丰富的上下文信息并通过微调的方式快速有效的构建中文分词模型。本文在BERT模型的基础上,针对检务公开活动场景的特点,采用序列标注的方式进行中文分词,并设计了法律领域词典和中文姓名词典特征的引入方法,以提升分词模型在法律领域上的分词性能。两种方式分别将F1值(加权调和平均值)在基准分词模型基础上提升了1.1%和2.6%。使最终的分词模型在法律文书数据集上的分词效果相对于常用分词工具有较好的提升。(2)基于图的语义依存分析研究。语义依存是一个融合了语义角色标注和句法分析的联合模型,不在受限于语句表面的句法结构,可以获取深层次的语义依赖信息。本文采用基于图的思想以双层Bi LSTM(双向长短时记忆网络)算法为核心构建了中文语义依存分析模型,并在此基础上设计了在模型中融入法律语料的BERT嵌入向量以及建立法律词语依存关系词典两种方法,来提升模型的性能。实验表明,在检务公开问句集上,可以将LF(弧标签F值)在基准解析模型基础上分别提升1.02%和1.19%。(3)SPARQL查询语句构建方法研究。对于RDF框架构建的知识库,SPARQL可以进行高效准确的检索,不需要理解特定于领域的关系或类型,即可获取该数据和询问相关问题。本文以查询三元组为核心,通过对检务领域问答对的研究和分析提取出简单的抽取规则,将语义依存结构解析成查询三元组列表,并根据策略转换成SPARQL查询语句,查询语句可以用于检务公开领域法律知识图谱或者法律知识库的检索查询。本论文依托于最高检国家重点研究项目展开研究,通过中文分词、语义依存分析以及SPARQL语句等技术实现对检务咨询问句的语义理解架构,实验结果表明,该架构能够从语义角度有效的将咨询问句转换为SPARQL查询语句,不仅在检务公开活动场景下为用户提供了高效获取答案的新方式,也为后续项目的研究奠定了良好的基础。
其他文献
近年来,人工智能、机器学习等词汇越来越频繁地出现在普通大众的生活中,并和我们的生活息息相关,在生活中随处可见的智能音箱、智能语音助手和人脸识别系统中都应用了此技术。传统机器学习在经历低潮后,随着深度学习的提出、大数据时代的到来和硬件设备的不断更新再次迎来发展高潮。5G技术的发展也让自动驾驶技术朝着理想方向进一步发展。神经网络(Neural Network,NN)是机器学习的重要算法之一,它是一种模
中国人民银行于2010年颁布并实施了《非金融机构支付服务管理办法》,意味着我国第三方支付机构被正式纳入了政府监管的范畴,走上了合规有序发展的轨道。随着第三方支付的不断创新发展,其风险也从最初的资金沉淀风险、信息泄露风险,衍生出混业经营风险、系统性金融风险等。若对此类风险放任不管,则会对消费者合法权益造成极大威胁,对社会经济稳定带来极大隐患。因此,要实现第三方支付市场的健康可持续发展,让更多消费者享
学位
近年来,储能技术在微电网的灵活调峰应用中发挥着重要作用,其不仅是确保微电网稳定运行的关键技术,也为分布式电源技术在微电网中的广泛应用起到了积极的推动作用。目前,以锂
蛋氨酸作为机体内多种物质的合成前体,可有效调节机体代谢平衡,目前被广泛应用于食品、饲料、医药等行业。微生物发酵法生产氨基酸因具有原料利用率高、操作简便、环境污染小等优点已逐步取代传统化学分离法,但由于蛋氨酸代谢合成途径长、合成过程中多个酶受到复杂的调控抑制作用,至今无法实现微生物发酵工业化生产。本研究以代谢结构清晰的谷氨酸棒杆菌为初始菌株,扩增前期研究获得的高酶活且解除部分反馈抑制的北京棒杆菌(C
面对种类和数量日益增长的Android应用程序,具有良好分类和描述信息管理的应用市场有助于用户进行程序搜索和推荐。目前应用市场中的程序分类以及描述信息的提供主要依靠人工操作完成,而已有的自动化分类研究工作均因特征选择不当或对已有信息分析不充分,导致对应用程序的分类准确率较低。且在描述信息方面,目前尚缺少相关的自动化研究工作。错误的分类或不准确的描述信息会导致用户下载到不相关的应用程序,不利于维护市
基于新课程标准的提出,教育部提出了相对完善的教育改革方案,即使是在新冠疫情期间,教育部仍然传达出要稳步进行教育改革。同时,随着新课程改革的不断推进,高中数学教师越来越意识到教学模式在教学中起着至关重要的作用。在准确把握数学六大核心素养的基础上,数学教师也在不断探索着更适合高中生数学学习的教学模式。主题教学(亦称“主题式教学”)立足于“以学生发展为本”,改变学科本位的观念,能够在现实角度中实现真正的
P2P网络借贷是信息科技和金融创新结合的产物,是我国互联网金融市场的重要组成部分,由于其低门槛、操作便捷等特点,与传统金融市场的需求缺口相契合,普惠了众多借款人和投资人。在我国,自2007年拍拍贷成立以来,行业以星火燎原之势蓬勃发展,伴随着网贷平台数目的激增,国内P2P市场百花争鸣的格局逐渐形成。笔者整理P2P相关文献发现,多数研究基于投资人对借款人的选择和信用风险的识别,而笔者认为,在我国P2P
软件可靠性评估性能直接影响软件测试的工作量,准确预测软件可靠性是一项极具挑战的任务。近年来由于计算机技术的发展与普及,计算机软件的功能和用途也复杂多样,并因其在人类社会中扮演着越来越重要的角色,人们的生产生活已经越来越离不开计算机软件的参与。因此软件质量问题受到越来越多的关注,软件可靠性是衡量软件质量的的一个重要属性,如何发布高质量的软件产品是一件非常困难的事情,因此以软件可靠性为核心的研究一直是
大型电力变压器是电力传输过程中不可或缺的电气设备之一。随着广大电力用户的用电需求增大,电力传输电压等级的提高,以及工业制造水平上升,单台变压器的容量也变得越来越大,
雷达系统的波形设计是雷达探测的关键技术,基于不同的雷达任务需求,不同的波形被应用,包括最低旁瓣发射波形、认知波形以及正交波形等等。多目标雷达波形优化设计针对的是多种需求下的波形设计问题。本论文波形的优化主要分为两个方向,即先优化波形的谱函数再搜索谱函数拟合较好的时域恒模波形和直接时域波形优化。针对星载雷达的单发射波形设计,本论文提出一个平衡模型,同时兼顾波形的互信息、积分旁瓣与主瓣能量加权和。相比