基于自然语言处理裁判文书的辅助审理方法的研究

来源 :福州大学 | 被引量 : 0次 | 上传用户:shmilygang8751
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着司法透明的不断提高,使得公众对于司法裁判的关注度越来越高,需要司法人员进行更加公平的案件判决。本文通过利用自然语言处理技术对司法裁判智能化辅助方法的研究,以裁判文书集作为实验数据,旨在提高司法人员的工作效率以及促进更加公正的案件审理。主要完成工作如下所示:1.基于司法裁判智能化辅助方法的需求及人工智能在法律领域中相关技术研究,利用裁判文书作为数据资源,提出了以罪名预测和相似案例文书推荐相结合的辅助审理方案,并详细介绍了辅助审理方法所涉及的自然语言处理技术以及做了相应的基础工作,主要包括:文书数据预处理,构建案例库,分类器训练,人工标注打分等以便后续的辅助审理方案的实现。2.在罪名预测研究中,针对传统CHI特征选择存在低频词缺陷问题、特征子集选取过程没有考虑特征项在类别内部分布均匀度、以及倾向于选择与类别呈负相关的特征项这三处缺陷引入频度因子、类内分布均匀因子和负相关修正因子进行改进,将提出改进的卡方统计特征选择Imp_CHI应用于罪名预测。3.在相似案例文书推荐研究中,传统的TF-IDF模型没有考虑到语义信息,并且常见的Doc2vec模型在案例文本表示中通常会忽视个体单词对整篇文档的影响。针对上述问题,本文研究引入了一种兼顾词频以及语义关联度的文本表示方法Sif-Word2vec用于相似案例文书推荐。4.最后对本文提出辅助审理方法进行实现,并分别对改进卡方统计特征选择方法Imp_CHI和加权模型Sif-Word2vec进行实验验证。实验结果表明,基于本文提出的改进卡方统计Imp_CHI的罪名预测最佳结果准确率P为95.25%、召回率R为95.20%、F1值为95.22%,均优于CHI、IG两种方法;在案例文本的相似性计算与推荐中,采用Sif-Word2vec模型的评估结果Precision@5为87%和DCG@5为7.4432,均高于采用TF-IDF、Doc2vec模型的评估值。根据实验结论可得,本文的改进方法Imp_CHI有着更好的特征选择效果,提高了罪名预测精度;在相似案例文书推荐中,本文引入的加权模型Sif-Word2vec兼顾个体词频和语义信息在文本表示方面效果更好,提升了推荐性能;因此本文提出通过罪名预测给出判决建议和以相似案例文书推荐提供审核参考的辅助审理方法在实践方面具有可行性。
其他文献
大跨度斜拉桥拉索由于具有刚度小、质量轻和阻尼比低等特点,当在桥梁施工期拉索尚未安装阻尼器时或在桥梁运营期拉索阻尼器性能已退化或失效时,尽管拉索采用了用于风雨振的气动控制措施,如拉索表面设置凹坑或缠绕小直径螺旋线,部分大跨度斜拉桥拉索仍存在风致振动问题。如近年来部分大跨度斜拉桥如苏通长江公路大桥、荆岳长江大桥等已发生了明显的拉索高阶振动现象。拉索高阶振动具有振动位移小、加速度响应大及频率高的特点,若
随着社会的不断进步,我国工农业得到了迅速发展,工农业废水日益增多但缺乏有效的处理手段,往往导致严重的环境问题,这些工农业废水污染物很难被自然降解并且对环境有很大的危害[1],不能直接排放。在众多含有染料及抗生素的废水处理技术当中,最常用的方法有化学氧化法、生物降解法以及吸附法[2-4]。吸附法在处理的过程中由于不产生二次污染且操作简便,吸附剂成本低、吸附效率高等优点使其在工业治理废水中得到广泛使用
鉴于市面上搜索引擎的搜索结果繁杂且针对专业领域的问答结果很少的情况,提出了一种基于优化后Att-BiLSTM-CRF深度学习模型的问答系统的构建方法。将机械专业的问答数据与智能问答技术结合起来,实现了导入问答文档进行自然语言处理后自动生成对应齿轮传动知识图谱的功能。在用户输入问题后,系统会通过文本相似度算法和Viterbi最优路径算法来匹配关键词。实验表明,其回答内容大部分都具备合理性且准确率高,
为了强化同领域同项目的跨区域金融联动合作支持乡村振兴,构建省际金融联动支持乡村振兴机制,打造跨区域联动合作平台,以滇桂黔石漠化片区的云南文山壮族苗族自治州、贵州黔西南布依族苗族自治州、广西百色市三地为例,采用产业地域联动模型,定量分析跨区域金融联动支持乡村振兴的运行绩效。结果表明,切实解决滇桂黔石漠化片区的乡村振兴问题,需要加强区域内的有效联动,三地以民生领域项目的跨区域联动尤为突出,强化同领域同
近年来,因人工智能技术的日趋成熟,自动驾驶已成为汽车领域的研究热点,引领汽车行业发展浪潮,各大汽车制造厂商以及互联网企业纷纷入局并在特定园区场景中进行技术测试与应用,推动自动驾驶商业化进程。自动驾驶系统主要包括环境感知、定位导航、规划决策以及运动控制等模块,其中,定位导航模块为决策和控制模块提供准确、实时的车辆位姿估计信息,是自动驾驶系统不可或缺的重要组成部分。目前自动驾驶系统大多利用GNSS/I
随着我国城市化进程的不断加快,投入运营的污水处理厂数量的不断增加,污泥的产量也日益增大。污泥中含有病原微生物、虫卵等有害物质,如不妥善处置,会对环境造成严重的影响。污泥厌氧消化因能实现污泥的减量化、无害化、资源化而备受关注。正常情况下污泥有机质含量(挥发性有机固体含量/总固体含量,VS/TS)为60%~80%,而一些污水处理厂由于特殊的处理工艺,污泥有机质含量只有50%甚至更低,低有机质含量造成污
基于2015年中国健康与养老追踪调查数据,引入经济支持、生活照料、精神慰藉以及社交活动四个关于社会支持的变量,将幸福感作为中介变量,探究社会支持对老年人健康的影响机制,为改善老年人的健康状况提供参考。运用OLS回归分析方法,实证考察了四个变量对老年人健康状况的影响效应。结果显示,社会支持对老年人健康状况有直接增益作用,对老年人的幸福感也有显著的正向作用。老年人的幸福感在社会支持与老年人健康状况之间
城市轨道交通具有高效、清洁、安全、便捷、运量大的特点,近年来在我国得到了快速的发展。大部分地铁车站主体设在地下,地铁车站人员密度大、通风性差,为了满足人们对地铁舒适度的要求,必须设立空调通风系统,该系统是人们对地铁所提出的要求,属于地铁必不可少的组成部分。国家大力推进节能减排工作,采用合适的通风空调的形式,选择高效的节能控制策略,是地铁车站中央空调系统节能和提高地铁运行经济性的关键。本文以长沙地铁
地铁具有运量大、时效性高以及低污染等特性,许多大中城市都已开通地铁线路或将地铁建设规划提上日程。地铁的运营一定程度上缓解了密集人口城市的交通出行压力,加快城市通勤效率,在城市公共交通中占有重要地位。为了提升地铁运行的服务水平,保障地铁安全稳定运行,地铁客流的预测研究是其中的一个重要课题。OD(Origin-Destination)客流是乘客出行动态分布的一个最直观的展现,一个精确的OD客流预测模型
铁路运输是组成全球交通运输网络的非常重要部分和关键的一部分,在国民经济发展中起到了关键性作用。随着我国高速铁路前以所未有的速度发展,列车车辆的技术日新月异,列车结构越来越复杂,因此对安全、可靠性、可用性等技术要求也越来越高。但是牵引系统各部件由于运行条件复杂,受腐蚀、温度、湿度等影响,且长时间运行在振动剧烈、冲击频繁的恶劣环境下,其内部机械、电气等各组成部分必然出现老磨损和老化现象,从而导致时有发