基于文本相似度和危险性评估的社区矫正方案推荐技术研究与实现

来源 :山东大学 | 被引量 : 0次 | 上传用户:huangjl41
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社区矫正是我国一项重要制度,对优化刑罚资源配置、提升教育改造质量大有裨益。社区矫正工作能否取得良好成效很大程度上取决于社区矫正工作人员制定的矫正方案是否合理。随着社区矫正工作在全国的推广普及,社区服刑人员数量大幅增加,同时因为社区矫正制度的日趋完善,采集到的社区服刑人员信息也愈发丰富,这都使得矫正工作人员制定矫正方案变得更加困难。目前矫正方案的制定完全依赖于人工对社区服刑人员的信息进行综合分析,需要花费大量的时间和精力,但现阶段司法所配备的矫正工作人员有限,可能因工作任务繁重,不能深入了解社区服刑人员的情况,导致制定的矫正方案流于形式,实施效果较差。另一方面,矫正方案的制定严重依赖矫正工作人员自身的经验,存在较强的主观性,可能因矫正工作人员理论及实践经验的不足,导致制定的矫正方案千篇一律,缺乏针对性。针对上述问题,本文提出了一种个性化社区矫正方案推荐方法,所做的主要工作如下:首先提出了一种基于文本相似度和关联规则的矫正方案推荐方法。通过对社区矫正典型案例进行分析,将其内容分为两部分。第一部分基本情况信息属于短文本,利用基于信息熵和逆文档频率加权的Word2Vec进行向量化表示。第二部分犯罪情况及生活环境信息属于长文本,经过特定文本预处理后使用Doc2Vec建模。根据两部分内容对整体信息的贡献度不同,提出基于权重分配的相似性度量方法,分别计算两部分内容的相似度并赋予不同的权重。之后基于协同过滤思想将相似度最高的社区服刑人员所接受的矫正方案作为推荐方案。通过对矫正方案进行分析,发现其中有些矫正措施经常一起出现,存在着一定的关联关系,提出了一种由频繁项集挖掘关联规则的方法,通过分析矫正措施之间协同出现的规律,挖掘出有价值的关联规则,对已有的推荐结果进行补充。其次提出了一种社区服刑人员危险性评估方法。针对再犯罪数据集涉及敏感信息多、特征多等实际问题,对数据集进行了预处理和特征选择。为了解决再犯罪数据集的不平衡问题,先利用SMOTE算法进行过采样,再引入数据清洗技术Tomek links删除噪声点,之后基于XGBoost算法建立危险性评估模型。根据评估结果,对危险性较高的社区服刑人员补充更为严格的监督管理相关矫正措施。最后在上述研究的基础上,通过对社区矫正工作的实际需求进行分析,设计并实现了社区矫正方案推荐系统。该系统能够为指定社区服刑人员推荐矫正方案,并支持矫正工作人员对给出的方案进行审核和修改。
其他文献
培养学生的口语交际能力,既是新课程改革大背景下语文课程标准的要求,又是学生全面发展、终身发展的要求。高水平的口语交际能力不仅能够使学生在不同的交际场合恰当地使用语言、游刃有余地处理不同的语言材料以及拥有儒雅的气质和文明的举止,更是在教育现代化、教育国际化的大环境中提高学生的情商,促进学生的思维发展,真正将我国的学生培养起来,让他们成为德智体美劳全面发展的优秀人才,从而为他们终身的学习、生活和工作奠
在机械加工中不可避免的会出现毛刺、飞边等产物,随着零件加工精度要求和洁净生产需求的提高,毛刺去除已经成为影响零件精度和洁净的关键。发动机、液压件内常有作为润滑油传输的深孔和交叉孔,深孔及交叉孔加工中产生的毛刺不仅观察和去除困难,其在油的驱动下进入运动部件内部,加速其磨损。交叉孔相贯毛刺与普通毛刺不同,深孔孔内空间有限且相贯线形状复杂,所以孔内毛刺去除和排出困难,现有方法未能有效、高效清理深孔和交叉
报纸
数控机床作为制造业的“工作母机”,代表着社会整体的生产制造水平。现如今,全球各制造强国均提出各自关于重振并发展高端制造的决定,数控机床首当其冲地必须进行全面升级,以适应智能制造模式。其中,智能运行优化决策是实现数控机床智能性的关键。以多目标优化技术为代表的数控机床智能运行优化决策能够实现在兼顾众多加工目标情况下,对现有加工方案进行优化,获取全局或局部最优的加工方案。然而,当前获得应用的多目标优化技
运用文献资料法和专家访谈法,对改革开放至今的体育文化研究进行了梳理。回顾这40年发展,可分为萌芽、快速发展、初步形成这3个发展阶段。开放与引进、人文奥运与文化自觉、多学科交融是各阶段的主要特点。从研究视角来看,体育文化研究是跨学科、学院派、整体观的研究。体育文化的概念、分类、研究对象、研究方法、体育与文化的关系、体育文化在体育界的身份与地位问题,是体育文化研究的重要问题。目前,体育文化重要性还未得
硬质合金圆锯片作为典型的切割工具,因其性能好、加工效率高等优点,广泛应用于木材、金属等材料的切割作业。然而,广泛采用的静态测试不能准确保证圆锯片动态运转中的性能,并且尚未有直接定义圆锯片动态稳定性的检测设备。本文应用ANSYS有限元软件研究圆锯片固有频率、模态振型等动态稳定性影响因素,设计并搭建圆锯片动态检测设备及检测系统,为圆锯片生产检测环节提供指导,通过试验研究单因素变量对圆锯片动态稳定性影响
3D打印技术通过材料逐层堆积成形的方法以零件三维数字模型为基础完成实体制造成形,具有快速、准确制造复杂结构零件的优势。熔融沉积成型作为一种被广泛应用于成形热塑性树脂材料零件的3D打印技术,由于成形材料多为普通树脂材料,通过该技术制造的零件通常力学性能较差,较大程度限制了其在工业领域的应用。近年来,使用耐高温树脂材料及纤维增强树脂复合材料等打印材料以获得性能优异的熔融沉积成形打印件成为研究热点并具有
脚步声身份识别技术利用人行走时产生的声音或振动信号实现对行走人的身份识别,具有隐蔽性、非接触式、不易被伪造等优点,是一种非常有潜力的生物特征识别技术。由于脚步声信号幅值小,容易受到环境噪声干扰,给脚步声信号降噪等预处理带来很大困难,并且脚步声身份识别存在数据匮乏、识别准确率低等问题。因此,开展低信噪比脚步声信号预处理和大量数据的脚步声身份识别研究具有重要意义。本文在总结国内外脚步声身份识别研究现状
42CrMo钢具有良好的力学性能,被广泛应用于重型、尖端装备制造领域,42CrMo钢属于难加工材料。近年来,硬态切削技术不断发展,使用硬态切削技术具有诸多优势,如加工表面质量好、加工效率高和“绿色洁净”等。因此,本文针对高强化锻钢活塞材料42CrMo钢的硬态车削加工工艺,探究切削工艺因素对加工表面完整性的影响,以期提高加工表面质量,实现抗疲劳加工。进行合金结构钢42CrMo车削正交试验与单因素车削
站在"两个一百年"历史交汇点,中国石油弘扬伟大建党精神,赓续红色基因血脉,锚定建设基业长青世界一流综合性国际能源公司的宏伟目标,为实现中华民族第二个百年奋斗目标贡献石油力量。长庆油田在国家大局中找准定位,在中国石油发展全局中强化担当,用伟大建党精神坚定信仰、保持信念、增强信心,大力开展挖掘整理、企地共建、教育示范、品牌打造"四大工程",不断汲取忠诚、担当、创新、奉献的力量,勇做保障国家能源安全的"