论文部分内容阅读
随着互联网应用的深入,电子邮件已经成为人们日常工作和生活的交流方式之一,其快捷高效的联络方式也成为恶意信息投递者的首选工具。垃圾邮件规则过滤器是目前主流的反垃圾邮件的手段之一,依赖其高效的规则引擎,个人用户也可以使用自定义规则与系统规则联合作用达到更好的过滤效果。本文首先阐述了目前垃圾邮件的危害和主流反垃圾邮件的技术手段,然后简单介绍了电子邮件的工作原理和相关的传输解码协议、朴素贝叶斯和遗传算法原理。本文的研究重点是通过已分类的邮件集利用朴素贝叶斯和遗传算法得到符合SA格式的规则,并且提出了一种基于Linux网桥的适用于海量处理的反垃圾邮件架构,同时详细介绍了该系统各个模块的设计。最终实现了一种可以部署在邮件服务器前端的实时垃圾邮件防火墙。该架构可以满足海量接入的请求,系统的接入层与业务逻辑层可以独立部署,并且可以根据处理的压力灵活的增加或减少处理进程。