面向政法大数据的搜索平台设计与实现

来源 :东南大学 | 被引量 : 0次 | 上传用户:huanjian1012004
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文书搜索是政法大数据管理的重要功能之一。文书搜索子平台面向政法部门,旨在帮助用户快速查阅文书。通过阅读文书,用户可以学习文书的写作规范,了解案件的审理流程。目前,国内最权威的文书检索平台是中国裁判文书网。该平台为用户提供针对各类案件的检索功能。同时,该平台也存在精准检索功能不完善的问题。本文主要针对文书精准检索问题提出解决方案,并搭建一套完整的搜索系统。本文的主要工作如下:(1)实现了文书内容抽取。抽取的信息包括文书段落、当事人、律师、律所、法律依据和关键词。文书内容抽取的目的是基于抽取的信息对文书进行精准检索。对于文书段落抽取,本文根据文书特点提出一种基于触发词的文书段落划分算法。对于关键词,本文采用TF-IDF算法进行抽取,并通过发现领域新词来提升关键词抽取效果。(2)实现了文书搜索系统。主要工作包括同步数据、搭建搜索服务以及实现功能模块。数据同步的目的是将文书数据从关系型数据库同步到到索引库。本文采用消息队列解决数据同步过程中出现的多平台协作问题。搜索系统采用Elasticsearch作用搜索服务,因为该服务具有面向集群和易扩展等特性。功能模块分为搜索平台和管理后台。搜索平台为用户提供搜索相关的功能,包括文书检索、搜索词提示以及搜索词联想。管理后台为用户提供管理搜索平台的功能,包括用户、同步状态以及词库等内容的管理。本系统现已成功上线运行,并得到了用户的认可。基于上述工作,本文对搜索系统各模块进行了测试。在数据抽取方面,本文提出的文书段落划分方法在一审判决书的各个段落的划分中均取得超过90%的准确率,本文采用的关键词提取方法在裁判文书的关键词提取测试中获得了64.2%的召回率。在平台功能方面,搜索平台和管理后台各模块功能均已实现且测试通过。
其他文献
再保险合约是保险公司分散经营风险,降低风险敞口,控制保险责任,扩大承保能力,锁定期望终端财富规模的重要工具。在实际再保险市场,保险公司可以选择分保或不分保,同时,再保险公司也可以决定承保或不承保,保险公司再保险公司之间关于再保险存在着一个博弈。再保险合约的签订的前提是需要保险公司和再保险公司双方对合约内容同时认可的。同时,投资对保险公司和再保险公司进行资产保值增值也有十分重要的作用,通过投资获得额
自改革开放以来,我国家电制造业迎来了较长时间的快速发展,但与此同时大量弊端也逐渐显现出来。在这段时期内,家电企业在生产上主要通过增加厂房设备等重资产投资以实现规模经济;在销售上,主要通过降价销售,甚至采用“价格战”等方式获得竞争优势。在特定时期内,这种发展模式确实给家电企业带来了丰厚的利润;而另一方面,也给企业的可持续发展带来了巨大的隐患,比如过度投资带来的产能过剩、产品技术含量不高且同质化严重、
同伴交往是儿童社会交往的重要形式之一,对儿童的社会性发展具有重要意义。在幼儿园中少数幼儿同伴交往不良,如被同伴拒绝或被同伴忽视。长期的同伴交往不良会对幼儿身心发展带来很大的负面影响,本研究旨在探求幼儿在同伴交往中被拒绝的原因。本研究采用个案研究法,深入被拒绝儿童一日生活的各个环节,通过现场观察、访谈的方式,了解儿童在园的行为特征以及与他人互动的情况,通过扎根理论方法对采集的数据进行分析,找出十二个
为了应对需求迅速变化的产品市场,近年来越来越多的制造商选择专注于产品研发与设计、市场开拓和产品销售,并将产品生产业务外包给契约商。随着产品生产业务由制造商转移至契约商,制造商不能对产品的质量进行直接的控制。作为能够直接决定产品质量的契约商往往承担了质量提升所需的全部成本,但提升产品质量带来的利润几乎全部由制造商获得,因此契约商常常缺少进行产品质量投资的动力。基于这一现实背景,研究协调供应链成员的质
动态载荷下飞行器贮箱内的流体介质与固体壁面间存在强烈的流-固耦合作用,所引起的冲击载荷严重威胁着贮箱结构的安全性,使得液体晃动成为飞行器贮箱结构设计中面临的关键问题。流体与变形体间的相互作用伴随着明显的非线性和非稳态特征,同时由于复合材料结构力学性能的复杂性,现阶段动态载荷下飞行器贮箱的液体晃动分析中存在计算效率较低、结构安全评估不准确等问题。因此,研究动态载荷下贮箱内液体晃动分析方法对飞行器贮箱
高技术产业作为我国重要的创新型产业和国民经济的战略性先导产业,对我国经济的发展发挥重要作用,其创新能力的提升对我国在全球经济中作用与地位提升起到很大的帮助。发展高技术产业,所需科研费用高,新时代下的高技术产业的发展不能仅靠规模,更要依靠合理配置有限的资金和资源使得产出尽可能最大化从而提升创新效率,这是一个值得研究的重要问题。我国OFDI流量和存量增长迅猛,国际对外投资大国的地位逐渐显现。学术界对O
本报告以英文原著《近代欧洲儿童史》(节选)为翻译实践材料,分析原著内容布局、语言特色和文体风格,梳理翻译中遇到的问题和难点,并论述在相宜的翻译理论指导下不同层面所采取的翻译策略、方法和技巧。原著为历史题材的通识读本或教材,预期读者群体为高中生或本科生以及历史学、社会学、人类学、地理学、教育学、文学等学科领域的高校教师,根据这一目标取向,译文应能适应国内具备相应知识水平的受众群体,因而对译文语言和文
现今全球面临能源紧张和环境污染等问题,迫使人们想方设法实现航空航天、汽车等领域产品的轻量化,达到减少油耗、保护环境的目的。碳纤维树脂基复合材料(CFRP)因为其诸多优良特性,如低密、耐热、耐磨、比强度高等,已广泛应用于航空航天、汽车、轨道交通等行业装备中,采用该类复合材料代替金属材料进行飞机、汽车等的轻量化设计已成为一种趋势。但由于CFRP零部件生产周期长、生产工艺复杂,制品成型速度低于金属件,使
提升储能产业在国家能源战略体系中的重要位置,组织开展储能领域重大战略研究,制定新型储能产业发展路线图。逐渐形成系统成熟的基础理论体系,立稳关键材料等底层核心技术环节支撑。发挥顶端应用领域的引领作用,加强引导应用需求与核心技术对接。
期刊
本次翻译报告的材料选自英国当代流行作家乔乔·莫伊斯处女作《躲雨》的第十三章和十四章(约17000个英语单词)。该书按照非线性叙事的方式,从三个不同的视角叙述了一家三代人之间的情感故事。书中有关人物心理描写的句子简单易懂,句式松散,反映了人物心理的复杂与矛盾。此外,书中人物对话较多,作者通过简单的口头对话塑造了各具个性的人物形象。另外,修辞的使用使得原文细节描写语言生动形象,富有表现力。最后,书中叙