基于层次分类的网络内容监管系统中串匹配算法的设计与实现

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:hotjune
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网上的反动、暴力、淫秽等非法信息使得网络内容监管日益重要。本文在对网络内容监管方面的研究现状进行分析后,采用一种层次分类的方法,即在信息识别过程中,先将网络信息进行关键字过滤,然后再将含指定关键字的信息内容传送给语义分析模块进行处理,从而减轻语义分析的压力,提高系统效率,并且适合于非法信息多变的特点。 关键字过滤通过串匹配算法实现,并且己成为系统性能的瓶颈。为此,本文分析了现有串匹配算法(包括单模式串匹配算法和多模式串匹配算法)的特点,设计并实现了一种适合于中文大字符集和网络内容监管的串匹配算法:基于QS算法的单模式串匹配算法(IQS算法)和基于Wu-Manber算法的多模式串匹配算法(IWM算法)。IQS算法主要用于工作人员的日后查阅,而IWM算法主要用于网络信息过滤。并且在中、英文两种环境下以及模式串的不同长度和个数情况下对IQS算法和IWM算法进行了实验比较分析,结果表明在运行时间与尝试次数方面整体优于其它算法,获得了较好的效果。 IQS算法和IWM算法已集成实现在网络内容监管系统中,用真实数据对该系统进行了测试,实验结果表明该算法表现出了较快的运行速度,系统的各项性能指标均已达到预定目标。
其他文献
本文所讨论的消息服务规范ebMS就是为B2B电子商务模式提供信息交换平台的机制,它是整个商务模式的基础,具有关键作用.本文围绕ebMS给出其规范分析、平台实现、对此平台进行的
  本文在研究了基于支持向量机的音乐分类方法基础上,针对隐马尔可夫模型适于处理连续信号和支持向量机适于处理分类问题的特点,提出一种支持向量机和隐马尔可夫相结合的混合
铁路信号联锁系统是行车安全的技术保障系统,就技术方面而言,铁路信号系统已经历了机械联锁、电气联锁(继电联锁)等阶段.随着电子技术、计算机的发展以及容错、避错理论与技
随着网络信息的发展,信息自动分类已经成为人们获取有用信息不可或缺的工具。贝叶斯作为其中的一种分类方式,应用在众多领域。贝叶斯方法的一大优点是利用了先验信息,能够在
程序理解在软件维护、遗留系统的现代化改造以及软件逆向工程等领域的关键技术。它具有重大现实意义和经济价值,不但可以避免重复劳动,提高软件生产的效率和质量,而且可以将
本文研究了图像融合的关键技术:图像拼接和超分率图像复原技术中的基本理论和算法。 视频图像拼接的关键步骤是图像对齐,即计算重叠图像间的运动场。本文针对摄像机旋转运动
随着生活智能化程度的提高,各种智能系统已成为了生活的必需品,其中自动人脸识别系统更是以实用性强的特点受到极大的关注。相比于传统的基于指纹或基于虹膜的识别系统,人脸识别
随着科学技术的高速发展,需要处理的信息量迅速增加,要把海量科学数据作为信息,信息成为知识,迫切需要利用能从海量科学数据信息中发现、推理知识的有效方法。数据挖掘(Data
MANET网络是一种无中心移动多跳自组织网络,其灵活、方便的组网方式使其在灾后应急通信、战场战术通信及城市车辆交通等应用中具有无可比拟的优势。但由于受到资源、能源及带
随着无线通信技术、微型传感器技术和嵌入式计算技术的飞速发展和不断成熟,具有感知能力、无线通信能力和一定计算能力的低功耗微型传感器在世界范围内出现,对这种传感器以及