基于数据挖掘的垃圾邮件行为识别关键技术研究

来源 :北京邮电大学 | 被引量 : 4次 | 上传用户:sh_duoduo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的蓬勃发展,垃圾邮件的泛滥已经成为一个备受关注的社会问题。伴随反垃圾邮件技术研究和应用的不断深入,垃圾邮件的制造与发送手段也层出不穷,单一层面的反垃圾邮件技术已不能满足需求。本论文对垃圾邮件行为识别的关键技术进行研究,提出了一种新的识别方法,即在“信息-知识-智能”统一理论指导下,应用数据挖掘中的关联规则和序列模式挖掘,对邮件连接会话中收件人地址字段的信息挖掘进行建模,从而可在会话期将其识别。首先,我们从理论和实验上,证明已有的决策树行为识别模型与原有的内容过滤技术可协同工作。考虑到行为识别技术对于网络带宽和系统负载的保护功能,行为识别与现有技术相结合是可行且必要的。进而,我们继续从数据挖掘中的关联规则和序列模式挖掘入手,在邮件连接的会话阶段,对垃圾邮件的另一个根本特征之一——收件人地址特征——进行识别,使“垃圾邮件行为识别模型”可以进一步识别邮件列表攻击、收件人字典攻击以及动态IP发信等垃圾邮件发送行为。实验结果表明,添加邮件列表攻击识别后的“垃圾邮件行为识别模型”保持了较高的准确度;同时,召回数目是只采用决策树识别模型召回数目的近1.5倍。而收件人字典攻击识别以及动态IP发信行为识别的单项召回率均达到50%以上。本论文为反垃圾邮件提供了一个新的并且是行之有效的解决方案。
其他文献
仿真技术是现在科学技术的一个重要分支。由于其安全性、可靠性、可操作性、经济性以及可控性和可重复性等方面的优点,现在已广泛应用于工程的预研、开发、测试等过程。仿真技
【摘要】初中语文课堂教学作为教学中的重要环节,是学生接受语文知识的重要途径。课堂教学效果好坏与否可直接影响到学生对于语文学科的兴趣和学习效果,打造高效的课堂教学模式有利于提高初中语文教学质量,从而提高整体语文教学水平。  【关键词】新课改 语文教学 改革 研究  【中图分类号】G632.0 【文献标识码】A 【文章编号】2095-3089(2015)02-0051-01  随着我国新课程改革在初中
一、试验目的我们于一九七四年开始由江苏省洪泽湖地区引种沙打旺(Astragalus adsurgens Pall.)。经多年观察,证明该草具有耐寒、耐旱、生长繁茂、产草量高、适口性好等特点
绘画艺术领域博大精深,有形而上者谓之神、有形而下者谓之器,在美术学院的基础教学中,沿袭了西方传统的素描教学体系,秉承“素描是一切绘画的基础”这一教训,要求我们不断钻
【摘要】管理会计的主要功能是通过运用管理会计的专门方法,以满足企业内部管理者对企业进行规划、控制和业绩评价等管理活动的需要。本文中笔者通过对管理会计制度的重视程度、教学内容和教学方法等相关问题进行问卷调查,发现存在教学管理中内容理论与实践脱节、过于注重数学模型和计算及相关课程内容重复,教学方法和教学手段落后,教学案例匮乏等问题,对此提出重新编写教材、更新教学内容,采用案例教学等多种教学方式以及丰富
悬架作为车辆的重要组成部分,它决定着车辆操纵的稳定性和乘坐的舒适性。尤其是性能优越的空气悬架,目前已经在高档客车、公交车、重型货车和挂车上得到普及,并且正逐步成为豪华
【摘要】本文阐述了培养中职计算机专业学生职业能力的必要性,提出了要注重精讲多练,培养独立学习能力,通过项目教学培养学生的编码规范意识,开展丰富多彩的专业活动以培养学生职业能力,通过理论实践的一体化培养学生综合职业能力等若干培养学生职业能力的方法。  【关键词】中职 计算机 学生 职业能力 培养  【中图分类号】G718.3 【文献标识码】A 【文章编号】2095-3089(2015)02-0052
无刷直流电动机实际上是以电子换向代替机械换向的直流电动机,因而保持了直流电动机的优良特性,具有较好的起动和调速性能,又因为它无需机械换向器使电机的结构简单,可以从根本上
【摘要】在多数高校,“药物化学”是化学专业本科教育课程设置中的一门专业选修课。该课程内容繁多,本文探讨了以化学专业学生为授课对象时,如何在有限的课时条件下达到较好的教学预期目的。  【关键词】化学专业 药物化学 教学改进  【中图分类号】G642.0 【文献标识码】A 【文章编号】2095-3089(2015)02-0055-02  “药物化学”是一门综合性的学科,建立在生物学、医学和化学等学科基
东洋公社四岔大队位于临海东部的沿海地区,种蔗土壤为盐碱土,粘性重,易板结,含盐量较高,甘蔗产量低,一直徘徊在2~2.5吨之间。近几年来,这个大队在“农业学大寨”的群众运动中