基于先验知识的法条推荐技术研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:l525721
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在当下社会矛盾日益增多的情况下,大量司法案件涌入法院,而司法资源本身的局限性,导致法官面临严重的工作压力。在全面推进人民法院信息化建设背景下,大量法律裁判文书信息公开化,“法律人工智能”成为研究焦点。通过对裁判文书的挖掘与分析,不仅能为法院提供更加智能的技术来提高办公效率,还能为公众提供智能的法律咨询服务,促进司法可得。法条推荐作为实现这些目标的技术之一,一方面能为法官推荐在审判时可能适用的法条,提高工作效率;另一方面还能帮助当事人跨越司法鸿沟,提前了解案件审判倾向和相关法条,并形成最佳诉讼策略。本文详细分析了法条推荐问题,并介绍了法律裁判文书的数据特点,包括种类繁多、有较多法律领域专用词以及半口语化等,所以仅仅从字符匹配层面难以实现真正智能化的服务。由于LSTM(Long Short-Term Memory)与Attention机制(Attention Mechanism)能较好挖掘文本语义并关注重要信息,所以本文主要以LSTM和Attention机制为基础,通过对裁判文书案件基本情况进行语义分析来完成法条推荐任务。首先,本文提出了针对裁判文书特点的预处理方法,包括法条标准化、案由标准化、分词、建立法律专用停用词以及去停用词。为了验证引入先验知识对于法条推荐的重要性,本文提出两种法条推荐方法,分别是基于动态LSTM的法条推荐方法以及基于 LDA-LSTM(Latent Dirichlet Allocation,Long Short-Term Memory)的法条推荐方法,具体如下:(一)基于动态LSTM的法条推荐方法:法官在判案时经常会参考案件基本情况的内容,其内容与引用的法条实际上有很大关联。该方法通过对输入的案件基本情况序列进行语义分析,挖掘案件基本情况与法条的内在联系。主要通过动态LSTM对变长的输入序列进行处理,利用深度学习方法获得案件基本情况的语义向量,并基于该语义向量进行多标签分类,完成法条推荐任务。(二)基于LDA-LSTM的法条推荐方法:通过模拟人的注意力,即法官在阅读文书时会额外关注与文书主题相关的词语,来对案件进行审判。通过引入案件基本情况的主题向量作为先验知识,利用Attention机制,在计算注意力向量时赋予与主题相关的词更大的权重,并基于计算出的注意力向量进行多标签分类,完成法条推荐任务。不同于词袋模型如TFIDF提取文本特征,上述两种方法都能挖掘出文本的序列信息,并且引入先验知识的LDA-LSTM模型还能赋予与主题相关的词更大的权重。在实验验证阶段,本文以六种民事案由的裁判文书为数据集,设计了一系列对比实验。其中对比了本文提出的两种法条推荐方法与其他方法,验证了引入先验知识的LDA-LSTM模型的有效性。最后对比了所有方法的优缺点,并对未来的研究工作进一步展望。
其他文献
学位
湖泊是陆地生态系统的重要组成部分,支撑着众多生物的生存繁衍,对人类生产生活具有重要影响。湖泊的变化可以有效反应过去一定时间内气候改变和人类活动带来的影响。遥感技术快速发展的几十年间,对湖泊变化的研究已经取得了丰富而卓有成效的进展。但依旧存在一些不足之处,比如还未对全国大湖泊的变化趋势进行研究,在水体识别方面还存在些许的不足。本文围绕现有研究中存在的不足,从湖泊面积方面入手,探讨我国大型湖泊(鄱阳湖
随着智能移动设备的升级和普及,移动互联网监控及组态设计成为现代智能制造时代工业互联网应用的关键技术之一,用户希望使用手机等移动设备随时随地都能进行监控组态画面,而不是将工作地点局限在厂房和办公室。互联网技术发展迅速,编程语言愈趋完善成熟,网页程序表现能力和桌面程序表现能力相差无几,采用B/S(Browser/Server)模式设计,组态监控软件可实现跨平台特性,可在智能移动设备上运行。但是因为PC
CO2的电化学还原是一种极具前景的实现可再生能源高效利用和CO2增值的方式。然而,CO2的C=O键高度稳定,且水溶液中存在氢析出(HER)竞争反应,因此开发有利于CO2还原反应(CO2RR)而抑制HER的高效催化剂具有重要研究价值。其中,过渡金属和氮掺杂的碳材料(M-N-C)被认为是新型的单位点催化剂,在CO2RR方面具有巨大的潜力。但是,M-N-C单位点催化剂仍存在活性位密度低、电荷转移动力学迟
随着信息化社会的发展,法律系统也迎来了信息化改革,最高法院提出建设立足于时代发展前沿的“智慧法院”。数据有效性与专业性是实现法律信息化的前提与基础。传统的数据采集以统计为导向,多靠人工录入,存在由于主观性强而导致数据不够客观的问题。如何将标准不一的主观性文字描述信息转换成统一标准的结构化数据成为关键。本文研究的大数据案例解析系统便是为了解决上述难题而诞生的项目。本系统对法律文书进行信息提取,将其转
水体流动会影响沉水植物的生长与分布,从而限制沉水植物的恢复。本文以沉水植物苦草(Vallisnerianatans)为研究对象,重点探索了水体流动对水体溶解氧(Dissolved Oxygen,DO)含量、苦草的生理生化特性及苦草叶片表面附着生物组成的影响,并通过水体流动与静态的转换进一步验证水体流动对苦草生长的影响,从水体流动影响水体DO含量而对苦草产生影响的角度出发,探究不同DO含量对苦草生理
近年来,随着各行各业大数据分析处理应用需求的不断增长,各种不同类型的数据库系统得到了蓬勃发展。这些系统在查询语言、计算模型、系统架构与底层存储技术等方面往往存在很大的差异,大大增加了大数据分析处理的复杂度,也限制了跨平台查询分析的可能性。同时,许多现实的业务也提出了通过SQL语句便捷、高效地执行跨平台查询的需求,跨平台查询逐渐成为学术界与工业界的一个研究热点。为了解决跨平台查询系统的易用性、统一性
我国普惠金融的概念是在第十八届三中全会被正式提出来,最开始的表现形式是小额信贷和微型金融,经过长期发展,已基本上覆盖了储蓄、保险、支付、信贷和理财等金融服务和产品。其目标是为了解决中国目前金融资源配置失衡的现实情况,促使金融产品和服务由发达地区向欠发达地区转移,我国境内不管是经济发达地区还是经济发展水平落后地区的居民都可以平等地享有金融服务,打破城乡之间不协调的僵局,使贫富差距的畸形在我国得到根本
近年来,人们对海洋的探索和认知能力日益提升,这与海上技术装备的发展密不可分,尤其是水下航行器。这类装备在海域防护和边境争端等方面发挥着巨大的作用,而在水下航行器外部的消声材料之间需要密封胶的嵌缝密封。本课题根据水下航行器裸露表面用密封胶的使用环境,研制了一种耐海洋环境的聚丁二烯型聚氨酯脲。主要研究内容如下:(1)双组份聚氨酯脲的固化特性以端羟基聚丁二烯和TDI合成端异氰酸酯基(-NCO)预聚体,再
金融被视为国家经济发展的命脉,金融发展水平与金融标准化程度对国家和地区的经济增长均起着至关重要的作用。总而言之,中国的金融行业显示了一个井喷式的发展趋势,但由于缺乏相关的法律法规,金融要素的分布并不均等,中国金融业呈现出金融结构二元化的格局。大量的金融资源集中在城市、大企业和富裕群体,使得农村地区和贫困群体变成被金融要素排斥在外的主要对象。这在一定程度上导致了城乡之间、群体之间以及地区之间收入差距