结合特征和非特征信息改进Nave Bayes及其应用

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:xiangzuobuxing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
朴素贝叶斯算法是一种常见的基于内容的垃圾邮件过滤算法,但是,传统朴素贝叶斯过滤存在判断内容的不确定性和邮件表示不完整性等问题。分析邮件信头各域在正常邮件和垃圾邮件中表现出的不同属性,提取非特征信息,结合特征信息和非特征信息改进朴素贝叶斯算法。实验结果表明,改进的朴素贝叶斯分类方法与单纯使用特征信息的方法相比,垃圾邮件的召回率和准确率更高,凸显了该方法涵盖邮件信息、克服内容判断缺陷的优势。 Naïve Bayes algorithm is a common content-based spam filtering algorithm. However, the traditional naïve Bayesian filtering has the problem of judging the content uncertainty and mailing incompleteness. The different attributes of mail header fields in normal mail and spam are analyzed. Non-feature information is extracted, and the naive Bayes algorithm is improved by combining feature information and non-feature information. The experimental results show that the improved naive Bayesian classification method has higher recall rate and accuracy compared with the method of using only feature information, which highlights the advantages of this method in covering e-mail messages and overcoming the defects of content judgment.
其他文献
目的探索艾滋病病毒(HIV)阳性的静脉吸毒(IDU)人群和男男性行为(MSM)人群,IgG、IgG1-4是否有差异。方法抽取652份血清/血浆样品,其中正常人315份,HIV阳性静脉吸毒者222份,HIV
《宇航学报》创刊三周年了。一九八三年八月下旬,编辑委员会在北京召开扩大会议。出席会议的编委和院校、科研所、机关的同志共计四十七人。主编任新民同志、副主编梁守槃、
目的探讨艾滋病合并肺部感染的病原学特征及与免疫功能的关系。方法回顾性分析了68例艾滋病合并肺部感染的致病原因,以及与免疫功能的关系。结果肺部感染是艾滋病最常见的机
在新课改的背景下,初中思品教学一方面呈现出许多可喜的变化,另一方面也出现了许多新的问题。在教学实践的基础上,谈一些尝试和体会。 In the context of the new curriculu
当今,社会正处于快速发展和不断转型时期,消防科普教育,是社会稳定发展不容忽视的基石。我校结合自身特点,依托“消防科普园”积极编制安全教育校本课程,分年级开展消防科普
学生的教育工作主要就是通过课堂教学这种形式来实现的,因此,高中生物教师在传授知识的过程中需要创建有效的、高效率、高质量的课堂教学效果,以保证学生的学习成绩能够显著
文章首先对IT基准安全防护手册(ITBPM)进行了详细的介绍。然后,在分析了高校校园网业务的基础上,应用ITBPM中五个标准环节进行校园网信息安全的分析和安全防护措施的设计。为
目的 :进一步探讨汉语阅读障碍 (RD)儿童的认知特点及其认知亚型。方法 :采用韦氏儿童智力量表 (C -WISC)和韦氏记忆量表 (WMS -RC)以及汉语阅读技能诊断测验 (CRSDT)对 172
中國人民打碎了帝國主義、封建主義、官僚資本主義的三道枷鎖,他像巨人似的在世界上站起來了!站起來了以後向着英明的共產黨指出的光明大路,已勇敢的前進兩年了。在這兩年中
品牌化建设是高等学校非学历教育的有效做法和成功经验,品牌化建设就是将继续教育系统化,形成具有影响力的品牌项目,以品牌优势促进继续教育的可持续发展。从广西民族大学继