基于文本挖掘的公益司法智能研究

来源 :首都经济贸易大学 | 被引量 : 0次 | 上传用户:jiaolang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自全国人大常委会授权最高人民检察院提起公益诉讼试点起,公益诉讼领域从理论到实践都得到了不断的完善。公益诉讼线索发现是办理案件的前提和先决条件,线索的数量与质量决定办案的最终效果。借助文本挖掘技术通过监控网络数据拓宽公益诉讼线索来源渠道,促进“互联网+司法”的发展,网络文本作为一种重要的数据承载形式也是发现公益诉讼线索的切入点。本文立足于检察机关视角,以某省公益诉讼办案指挥中心平台建设项目为背景,主要研究公益诉讼网络线索识别和线索责任主体判断以及相关法律条文推荐,以拓宽公益诉讼线索渠道和提高检察机关工作效率。本文采用自然语言处理、文本挖掘的方法实现网络公益诉讼线索识别工作,主要包括:首先,对爬虫获得的潜在案源线索数据进行数据预处理,其中包括数据清洗,人工打标签等。其次,对文本数据标题和内容进行中文分词、提取关键词、文本量化等,并对标签为案源线索的文本数据进行可视化,展示并挖掘网络公益诉讼线索的现状。再次,采用文本分类模型fastText模型和TextCNN模型对潜在案源线索数据中的线索数据精准识别,其中fastText分类模型在短文本线索标题数据更具优势,TextCNN模型在线索详情数据模型上效果更佳,本文还结合两模型的优势,建立基于fastText和TextCNN混合分类模型,混合模型在识别线索准确度上有一定提高。为优先处理重要的公益诉讼线索,本文设计构建公益诉讼线索成案指数,并通过线索数据进行实例验证。最后,对已判断为线索的案源数据利用文本相似度分别计算案源线索与权责清单数据和法律法规数据的相似度,以确定案源线索对应的责任主体机关,以及推荐相关法律法规。
其他文献
具有晶体结构的软岩在流变变形破坏过程中,伴随有大量的微细观位错演变和位错滑移现象,且随着位错滑移加快,流变变形破坏加速,导致如深基坑坍塌、地下工程塌方、建筑工程失稳倒塌等大规模岩土工程失稳破坏事故,更容易诱发如山体滑坡、崩塌等重大岩土地质灾害。因此,不仅要研究软岩宏观流变破坏力学机制,更要加强研究微细观位错滑移变形机理,才能揭示软岩流变破坏现象的微细观层次的本质根源。论文基于位错滑移理论,在国内外
电气设备行业在国民经济特别是工业领域中占有重要地位,目前该行业增速有所放缓但总体运行平稳。在智能制造背景下,电气设备行业与新兴科技融合发展,“智能化”生产与应用在该行业得到充分体现,一方面提高了行业附加值,扩张了行业发展空间;另一方面也体现为更高水平的行业竞争和更为激烈的市场竞争。LS公司是电力输配电系统综合解决方案的提供商,注重技术研发与创新,产品品类齐全,在电气设备行业中有一定的竞争优势。但L
中国传统法律思想的研究对象应当如何定位,或是中国传统法究竟涵盖了哪些内容的问题一直存在于中国法律思想史的研究中。由于西方法学理论中的“法”和中国传统文化中的“法”具有本质的区别,不应当将中国传统文化中的“法”字指代的单调含义默认为中国传统法的全部,应当从广义的法的层面审视中国传统法律思想。以此观之,春秋战国时期的诸子百家学说几乎都含有法思想。荀子虽然是战国时期儒家的代表人物,但是其法思想明确存在并
生物大分子是承载一切生命活动的功能性分子,生物大分子包括:核酸、蛋白质等,在遗传信息传递和细胞生化功能等方面发挥着重要作用。而除了了解其基础的结构和功能外,生物大分子的修饰研究也逐渐引起业界的关注。本文主要是对一种特殊的由异戊烯基为骨架的脂质修饰展开了研究。一方面,我们对香叶基化(两个异戊烯基)的t RNA的分子标记进行了探索。通过类似物策略合成了一系列香叶基焦磷酸衍生物,构建表达“写入”酶Sel
语义分割属于场景理解的范畴之一,是计算机视觉领域一个基础但是又具有挑战性的任务。近年来,随着深度学习技术的不断发展,深度卷积神经网络在语义分割方面表现出了优异的性能。然而,现有的许多基于深度卷积神经网络的语义分割方法由于使用了复杂的网络结构,它们的计算复杂度和时间消耗普遍偏高。这极大地限制了它们在真实场景(需要快速的处理速度)中的应用。因此,研究基于深度学习的实时高性能语义分割方法,是一项既具有重
随着我国消费者保健意识的日益增长和健身习惯的逐渐养成,功能饮料市场越来越显示出巨大的潜能,无论是本土还是国外企业都瞄准了这一商机,不断加大对中国功能饮料市场的投入。L品牌功能饮料作为行业的后起之秀,从2013年上市起便通过近5年的快速发展赢得了一定的市场份额,但自2017年起增速放缓,跟随策略的弊端逐渐显露。本文将从市场营销基本原理出发,通过文献研究法、调查研究法、比较分析法等手段围绕L品牌功能饮
随着无人车性能不断完善并向智能化方向发展,各种自动驾驶应用快速增长。车载应用的增加给车载资源有限的自动驾驶汽车带来了爆炸性的计算需求。边缘计算(Edge Computing,EC)通过应用程序卸载可以有效地缓解这一问题,为车辆用户提供低时延和高可靠的服务。然而,由于边缘计算资源的稀缺,无法满足所有卸载任务的时延要求,从而导致不可避免的资源竞争问题。对于资源有限的边缘服务器来说,针对不同的时延敏感性
随着政策法规对环境、社会和企业责任问题的逐渐关注,以及来自消费者和各利益相关者的压力,实施绿色可持续发展受到了企业的高度重视。汽车制造业作为支柱型产业,绿色化、智能化的发展模式已成为提高市场竞争力的必然趋势。Q公司也迫切意识到可持续发展的重要性,并将如何推动整条供应链的可持续稳定发展提高到了公司战略层次。在此研究背景下,论文从Q公司的供应商评价与选择决策现状出发,发现其传统的供应商评价体系已不能适
氢能作为一种清洁、高效、资源丰富的新能源,被认为是最具发展潜力的绿色能源,在能源转型过程中扮演着重要角色。在诸多的制氢方法当中,铝的水解制氢因具有低成本、高产氢量、氢气制备简单等优点,受到了研究者们的广泛关注。但是铝的表面易形成致密的Al2O3钝化层,严重阻碍了铝水解反应的进行。铝合金化处理是提高铝的活性以实现高效水解制氢的有效方法之一。本研究利用CALPHAD方法进行了合金成分的设计,通过气雾化
经济发展水平与国民收入的提高,消费观念的转变,带动了人们消费方式的升级,人们需要个性化、多元化、高层次的购物体验。与此同时,随着互联网络技术的发展,网络的普及,人们在网络上的时间越来越长,网络社交成为了人们主要的社交方式,因此许多电商行业也将注意力转移到了社交网站。在这样的背景下,电子商务尝试社交化,社交、共享、互动已经构成了互联网应用的核心要素。用户可以在各种网络社区平台上,不受时间空间的限制自