基于小样本学习的垃圾邮件过滤方法

来源 :计算机工程 | 被引量 : 0次 | 上传用户:kjnojn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对客户端垃圾邮件过滤器难以获取足够训练样本的问题,提出一种基于小样本学习的垃圾邮件过滤方法,利用容易获取的未标记样本提高垃圾邮件过滤的性能。该方法使用已标记的小样本邮件实例集训练一个初始Naive Bayes分类器,以此标注未标记邮件,再使用所有数据训练新的分类器,利用EM算法进行迭代直至收敛。实验结果证明,当给定5个-20个已标记小样本训练邮件时,该方法可有效提高垃圾邮件过滤性能。
其他文献
我国继特高压交流试验示范工程之后,第二个特高压交流输电工程--皖电东送1000千伏淮南-浙北-上海特高压交流输电工程(以下简称皖电东送工程)即将开工建设。皖电东送工程于9月27
《文化生活》课的教学目标是让学生深入了解文化知识,树立正确的文化价值观。库伦民间故事是贴近学生生活的最适合的生活化教材。教学过程中结合库伦文化资源能够激起学生的兴趣。《文化生活》课教学中应用库伦民间故事不仅能够有效的提高教学效率,还能提高学生的文化意识,学习和传承本民族的优秀传统文化。本论文主要研究库伦民间故事在《文化生活》课中的实际应用情况。首先论述了库伦民间故事的形成、特点和分类。其次论述的是
针对基于单一生物特征身份的签名方案在实际应用中存在的问题,提出一种基于多重生物特征身份的签名方案,研究基于椭圆曲线的n-挠群,对不同生物特征进行融合,介绍基于生物特征身份
目的探讨纤维支气管镜灌洗治疗重型颅脑损伤后肺感染的护理方法。方法对49例重型颅脑损伤后肺感染患者采用纤维支气管镜下吸痰灌洗,观察感染控制率及感染控制时间。结果 49例
针对密钥管理与路由信息脱离的现象,提出一种基于按需路由协议的多项式密钥预分配改进方案。该方案利用网络路由的拓扑信息和基站功能,使基站集中存储重要安全信息并承担大量计