【摘 要】
:
近年来,随着移动互联网时代的快速发展,即时通信得到了广泛的应用,不良信息泛滥成灾严重影响到人们的日常生活。如何对海量的不良信息进行采集、存储、挖掘和聚类分析,对于当
论文部分内容阅读
近年来,随着移动互联网时代的快速发展,即时通信得到了广泛的应用,不良信息泛滥成灾严重影响到人们的日常生活。如何对海量的不良信息进行采集、存储、挖掘和聚类分析,对于当今运营商实现集中治理不良信息的智能管理具有十分重要的意义。本论文立足于某企业的实际工作项目,设计了一种面向海量不良信息快速聚类的算法,并实现了一个不良信息相似聚类原型系统,从而为该企业完成不良信息的集中管理奠定了基础。本文的主要研究内容如下:本文对不良信息聚类所涉及的相关技术以及常用的聚类算法做了深入的调研。根据不良短信文本具有数量巨大、不规范性以及大量的相似性等特点,通过对比现有聚类算法对于处理海量信息,得出的查全率较低且效率偏低,于是本文提出了一种面向海量短信快速聚类有效的算法。该算法主要的实现方式是采取特定的特征串构建方法以及合理的选取聚类号。并通过多组实验证明了本聚类算法的查准率、查全率都高达85%且执行效率也得到了较大提升。本文将本聚类算法应用于不良信息集中治理中的垃圾短彩信智能优化子系统中,并通过数据可视化验证了算法在现实生产环境中的可行性。最后,本文对基于本聚类算法的不良信息相似聚类系统的总体层次架构及各功能模块进行了详细设计,并通过编码实现了包括预处理模块、特征选择模块、聚类分析模块以及查询检索模块的具体功能,完成了整个聚类系统的开发。并且还使用了大量的测试用例对系统进行了功能测试和效率分析,验证了系统的各个功能和效率,同时证明了算法在本系统中的实践效果。为企业信息安全中心的各种数据处理奠定了基础,以及后续其他子系统和模块的实现提供了成功的保证。
其他文献
碳纤维增强热塑性预浸料是复合材料成型制备过程中的中间材料,凭借着存储方便、耐热性好、成型质量高等优点得到广泛关注,由于热塑性树脂成型温度高、熔体粘度大,限制了热塑
如何实现纳米材料在性质和功能方面的可调控,是研究者们长期以来的关注热点。近年来,由于结构和尺寸的可控性,聚合物刷常被视为一种制备可控纳米材料的理想结构。然而,如何实
夹芯结构是一种轻质高强的新型多功能复合材料,且集热交换、抗冲击、能量吸收、电磁屏蔽等多功能性于一身,在航空、航天、船舶、交通等多种领域得到了广泛的应用。其芯部结构
本研究以加拿大疫情期间的应急远程教育为例,从政策、技术等宏观因素及教师、学生、家庭等微观因素出发,对其疫情期间应急远程教育实施过程进行详略得当的分析,特别对教师、学生及家庭等因素进行了重点阐释。具体来说,本研究将通过五个章节,从疫情前加拿大远程教育的发展概况、加拿大应急远程教育的已有准备、疫情期间实施应急远程教育时面临的挑战及其应对举措进行描述与梳理,并借助广受认同的、经典的4R危机管理理论对加拿
雄性不育是高等植物存在的一种现象,雄性不育材料的发现对于开展植物育性方面的研究具有重要意义。ogu-CMS作为十字花科作物遗传育种工作中运用广泛的雄性不育类型之一,其为杂交制种的育种生产工作和核质互作调控机制的研究工作提供了便利。乌菜是十字花科不结球白菜的一个变种。作为江淮一带广泛栽培的蔬菜物种,乌菜雄性不育方面的研究还比较少,其不育机理尚不明确。故进一步了解乌菜雄性不育的调控机理,对提高乌菜高效
随着国民经济的迅猛发展,大量岩体工程项目的兴建极大地促进了对岩体力学性质的研究。但由于岩石介质的天然复杂特殊性,目前人们对于岩体的力学行为仍不能进行准确且有效地预
瓦伦西亚烯是一种存在于各类柑橘果实中的萜类化合物,由于其较好的生物活性和香气,被广泛应用于香水、香皂、食品和饮料等的工业制造上。但由于其自然含量极低,且目前制备瓦伦西亚烯的方法较为麻烦且花费高,不利于瓦伦西亚烯的大量应用,因而构建细胞工厂进行瓦伦西亚烯的生物合成是更为高效和环保的方法。酿酒酵母作为普遍公认安全(GRAS)的真核微生物,目前已被大量用于各类天然化合物的生物合成,且其体内拥有内源萜类化
压水反应堆在运行的过程中,燃料包壳不可避免地会发生破损,当破损发生后积聚在燃料棒内的裂变产物将释放到一回路当中。其中,放射性裂变气体是一类重要的源项。裂变气体释放可以分为两个阶段:第一个阶段为从燃料芯块到芯块-包壳间隙,第二个阶段为从芯块-包壳间隙到一回路。目前,对第一个阶段的研究已经相当成熟,并发展出了许多计算计算程序;而对第二个阶段的研究暂时还处于假设阶段。在考虑第二个阶段释放过程时,往往简单
课题源于国家自然科学基金面上项目“含夹杂或裂纹非均质材料摩擦磨损的微观机理研究”(Grant No.51875059),“轴承钢接触疲劳的微观结构演化机理和实验研究”(Grant No.5147
开发钛合金复合材料有望解决航空航天领域对服役温度为600-800℃的轻质高强材料的需求。得益于特殊的增强相空间分布,网状结构钛基复合材料具有优异的综合力学性能,并且可以