基于小样本学习的垃圾邮件过滤方法

来源 :计算机工程 | 被引量 : 0次 | 上传用户：kjnojn

【摘要】

：

针对客户端垃圾邮件过滤器难以获取足够训练样本的问题，提出一种基于小样本学习的垃圾邮件过滤方法，利用容易获取的未标记样本提高垃圾邮件过滤的性能。该方法使用已标记的小样

【作者】

：

蒲洁珠周晓吴共庆胡学钢

【机构】

：

合肥师范学院计算机科学与技术系,合肥工业大学计算机与信息学院

【出处】

：

计算机工程

【发表日期】

：

2010年21期

【关键词】

：

小样本学习 EM算法未标记数据垃圾邮件过滤 learning from small samples EM algorithm unlabeled data

【基金项目】

：

国家“973”计划基金资助项目（2009CB326203）,国家自然科学基金资助项目（60975034）,安徽高等学校省级自然科学研究基金资助项目（KJ2009B238Z）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

针对客户端垃圾邮件过滤器难以获取足够训练样本的问题，提出一种基于小样本学习的垃圾邮件过滤方法，利用容易获取的未标记样本提高垃圾邮件过滤的性能。该方法使用已标记的小样本邮件实例集训练一个初始Naive Bayes分类器，以此标注未标记邮件，再使用所有数据训练新的分类器，利用EM算法进行迭代直至收敛。实验结果证明，当给定5个-20个已标记小样本训练邮件时，该方法可有效提高垃圾邮件过滤性能。

其他文献

国家电网皖电东送特高压工程即将开工建设

我国继特高压交流试验示范工程之后，第二个特高压交流输电工程--皖电东送1000千伏淮南-浙北-上海特高压交流输电工程（以下简称皖电东送工程）即将开工建设。皖电东送工程于9月27

期刊

高压工程国家电网特高压交流输电工程特高压电网示范工程规模建设负荷中心

电针治疗面肌痉挛临床观察

期刊

电针面肌痉挛针刺疗法

癔症性瘫痪误诊为脑血栓五例

期刊

癔症性瘫痪误诊诊断脑血栓

库伦民间故事在《文化生活》课教学中的应用研究

《文化生活》课的教学目标是让学生深入了解文化知识,树立正确的文化价值观。库伦民间故事是贴近学生生活的最适合的生活化教材。教学过程中结合库伦文化资源能够激起学生的兴趣。《文化生活》课教学中应用库伦民间故事不仅能够有效的提高教学效率,还能提高学生的文化意识,学习和传承本民族的优秀传统文化。本论文主要研究库伦民间故事在《文化生活》课中的实际应用情况。首先论述了库伦民间故事的形成、特点和分类。其次论述的是

学位

库伦民间故事《文化生活》教学应用

n-挠群上基于多重生物特征身份的签名方案

针对基于单一生物特征身份的签名方案在实际应用中存在的问题，提出一种基于多重生物特征身份的签名方案，研究基于椭圆曲线的n-挠群，对不同生物特征进行融合，介绍基于生物特征身份

期刊

n-挠群公钥密码系统数字签名n-toison group public key cryptosystem digital signature

实施护理干预提高支气管镜吸痰灌洗治疗肺感染的疗效

目的探讨纤维支气管镜灌洗治疗重型颅脑损伤后肺感染的护理方法。方法对49例重型颅脑损伤后肺感染患者采用纤维支气管镜下吸痰灌洗,观察感染控制率及感染控制时间。结果 49例

期刊

纤维支气管镜颅脑损伤肺感染护理

矩形髓内钉一期内固定治疗开放性胫腓骨骨折15例

期刊