面向裁判文书的文本标注系统的设计与实现

来源 :南京大学 | 被引量 : 0次 | 上传用户:hziyin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着全国法院信息化的深入发展,司法大数据的格局已经初步形成。裁判文书作为司法大数据体系的重要组成部分,其相关的挖掘与研究也日益受到人们的关注。然而裁判文书的种类繁多,结构复杂,使得文书内容挖掘研究有诸多困难。因此,开展文本内容标注工作,是实现裁判文书的文本挖掘的重要基础。本文基于上述背景,设计并实现了面向裁判文书的文本标注系统。系统分为五个功能模块,包括系统管理模块、未标注数据管理模块、标注任务管理模块、文书标注模块和已标注数据管理模块。其中系统管理模块包括用户账户的管理和分类标注的类别管理;未标注数据管理模块包括未标注数据导入、未标注数据转换和分类文书的自动预标注,将xml文书文件转换为Excel表格,为标注数据做预处理;标注任务管理模块包括标注任务分配、进度控制提醒、历史工作量统计和当前工作量负载统计,对标注任务调配和任务进程管理;文书标注模块分为关系文书标注和分类文书标注,针对不同标注需求提供不同文书标注方式;已标注数据管理模块包括分类、关系标注文书下载和分类标注数据统计,将标注结果导出并以图表形式呈现。在内容结构上,本文首先介绍了面向裁判文书的文本标注系统的项目背景,国内外文书标注现状,阐述了本文的主要工作,从宏观上对本文的组织结构进行了介绍。紧接着介绍了本系统所使用的相关主流技术,包括MVC的设计思想、Spring框架、Spring MVC、MySQL数据库以及Mybatis框架。通过对项目功能需求的分析,介绍了系统相关模块与数据库的设计,并且通过相关视图分析了系统的架构设计。接着基于系统的需求分析以及总体设计,重点讲述了各个功能模块的具体实现方案以及实现界面与效果。最后设计测试用例,对系统进行测试,确保系统满足功能性需求和非功能性需求。本文项目已在天津市各级法院部署应用,满足了法院裁判文书文本标注的业务需求,应用效果良好。
其他文献
随着城市化进程的加快,空间不足的问题越来越严重,发展地下空间是解决问题的最佳方式。城市地下的资源有很多种类,其中最主要的资源包括地下空间、地下水、浅层地热能以及地质材料。目前世界各国在城市地下空间开发过程中,对城市地下资源的协同开发尚缺乏科学的规划和管理。因此,研究地下资源的协同开发利用具有重要意义。本次研究依托中国科学院的中国城市地下空间开发利用的战略需求与开发前景咨询项目以及中国地质调查局南京
目的慢性肺曲霉病(chronic pulmonary aspergillosis,CPA)因其发病率升高、诊断延误、致残率高及医疗负担重等问题,逐渐受到临床关注。CPA患者在接受了积极的抗真菌治疗后,仍可能出现肺功能下降、病情反复进展甚至因大咯血、呼吸衰竭等原因而死亡。然而,目前关于CPA患者预后的临床研究较少,且未能详细阐述不同亚型CPA患者的预后。而已发表的研究中,患者生存率数据相互差异较大。
乳腺癌、肝癌和结肠癌在我国癌症的发病率和死亡率都在前五位,需要寻找有效的治疗和延长患者生存方法。慢性炎症在乳腺癌、肝癌和结肠癌的发生、生长与迁移等过程中,起到主要的促进作用。同时,由于各种炎症因子诱导肿瘤部位的骨髓增生,可以导致MDSCs扩增,而肿瘤组织中MDSCs细胞和Treg细胞的增长在肿瘤免疫抑制和血管生成中起到重要作用。因此,只有抑制或者中和肿瘤微环境中的炎症因子水平,才能激活机体的抗肿瘤
在网络化多级测控系统中,工作站和仪器分布在不同的地点,都可以作为网络节点。根据工作站的级别,工作站对其下级工作站、工作站对其拥有的仪器都存在测量和控制的要求。为了使各级工作站之间、工作站和其拥有的仪器之间能够更好的协同合作,需要统一的时间进行协调控制。多级测控系统中的时间统一系统的目的是让分布在不同地点的各级工作站,实现时间的统一和数据的一致。本文重点解决各级工作站时间不一致的问题,实现一个使多级
随着当今社会的信息化和智能化的发展,软件系统的规模日益增大,导致构建软件系统的代码越来越复杂。现在很多软件系统的实现依赖于已有的类库,这些类库提供的应用程序接口(Application Programming Interface,API)可以帮助提高软件开发人员的开发效率。为了正确地使用API,软件工程师需要获取API的详细说明信息。在API的详细说明信息中,调用API之前需要满足的条件称为API
基于安卓系统的移动终端占据了市面上大多数的份额,各类移动软件在社会生活中得到了大量的应用,但随着日益增长的需求、用户量,代码结构越来越复杂,软件中的错误发生的频率会急速提升。错误的产生会带来明显的用户流失,因此尽早地发现、定位以及解决安卓应用中存在的问题成了移动开发者亟待解决的难题。基于以上背景,本文设计并实现一个安卓端的通用的、轻量的、全面的数据采集SDK,负责采集安卓应用的各类数据,提供给移动
随着“互联网+物流”平台的兴起,运输领域也诞生了一种新兴业态——无车承运人。这种新业态使得交易更加安全有效,也对货源方和承运方提供了更多保障。无车承运人平台在交易的过程中,平台数据库内会存放海量数据,包括货主、车主的相关信息及交易数据等。通过高效的数据分析和数据挖掘手段,可以帮助企业发现更多隐藏在大数据背后的规律。同样地,数据挖掘技术在无车承运人领域的应用也能更好地帮助平台企业实现从大数据到商业信
随着市场经济的不断完善发展,减少政府过多的行政干预,充分发挥市场在资源配置中的主体地位,成为当前政府改革的重要内容。在市场监管工作中,越来越多体现出简政放权、放管结合、优化服务的特点,商事登记制度改革就是市场监管工作不断优化提升的一项重要内容,市场主体登记注册全程电子化的应用作为商事登记制度改革的一项创新之举,对于简化审批流程,提高办事效率,降低企业成本具有重要的意义。市场主体登记注册全程电子化被
学位
我国沿海各地基础设施建设中砂石材料需求量巨大。由于海上运输具有天然的成本优势,砂石料经由海路运输成为沿海各地的首选。然而,市场的需求和利益的驱使使得大量的低标船涌入海上砂石运输市场,给海上船舶航行造成了巨大的安全隐患。研究砂石运输船舶安全监管中存在问题,找到破解安全监管难题的有效方法意义重大。本论文选取沿海砂石运输船舶海事安全监管为研究对象,综合运用文献研究法、案例分析法、实地调研法等多种研究方法