论文部分内容阅读
随着网络技术的不断发展,电子邮件已经成为人们日常生活和工作中沟通的一种重要方式。然而,由于电子邮件先天安全的脆弱性,随之而来的垃圾邮件问题严重困扰着邮件用户,降低了邮件通信的便捷性。目前对反垃圾邮件这一问题已经有了很多研究,出现了很多反垃圾邮件技术。但是,由于垃圾邮件技术也在不断发展变化,这些技术往往只能在不长的时间内发挥作用。行为解析技术作为第三代反垃圾邮件技术的代表,在这样的背景下应运而生。这一技术与传统技术不同主要在于,它不依赖于邮件内容,仅把邮件的行为作为邮件过滤的依据,效率高,性能好。
在分析和总结现有行为解析技术研究的基础上,本文设计并实现了基于行为解析的反垃圾邮件系统。系统提出了两种行为解析机制,分别是基于邮件通信人际关系网络的浅层行为解析和基于会话和邮件头信息的深层行为解析。浅层行为解析以用户群组这一概念为核心,而深层行为解析则强调了解析中所使用的数据源。在把两种机制转化为具体模型后,引入了人工神经元网络ANN(Artificial Neuron Network)算法,把模型应用到反垃圾邮件领域中。为了提高运行效率,本文使用了完全散列技术和以神经元为中心的ANN表示方法。另外,系统把收到的邮件归档并存储到数据库中,便于今后的功能扩展和系统升级。
本文使用多种指标对实现的系统进行了全面的性能评价。评价结果一方面验证了两种行为解析机制正确性,另一方面表明了基于行为解析的反垃圾邮件系统性能良好。