【摘 要】
:
随着电子邮件的广泛应用,垃圾邮件作为商业广告、恶意程序或敏感内容的载体,也越来越对系统的安全和人们的生活造成了严重的威胁,反垃圾邮件问题已经成为全球性的具有重要现实意
论文部分内容阅读
随着电子邮件的广泛应用,垃圾邮件作为商业广告、恶意程序或敏感内容的载体,也越来越对系统的安全和人们的生活造成了严重的威胁,反垃圾邮件问题已经成为全球性的具有重要现实意义的课题。 邮件过滤技术是反垃圾邮件的重要手段,目前对垃圾邮件的过滤主要有基于内容、基于IP地址和基于信头、信封等方法,这些方法对垃圾邮件的过滤起到了一定作用。但是由于信体是垃圾邮件的最终载体,而仅依据IP地址、信头、信封中的特征容易造成错误判断。 本文提出了一种基于服务器端的垃圾邮件过滤系统,它采用改进的Bayes算法,将反映垃圾邮件的特征综合在一起统称为“属性”,用这些“属性”构成表示邮件特征的向量空间模型中的特征向量,避免了单纯基于IP、信头、信封过滤的规则性太强的缺点,降低将正常邮件判断为垃圾邮件的风险。 为了提高系统性能,本文研究了垃圾邮件过滤系统所需的各种技术,包括中文分词技术、中文分词词典机制、自动文本分类技术等。通过对各种分词技术进行比较分析,本系统采用向左增字最小匹配与向右减字最大匹配算法相结合进行分词,并采用互信息方法消除歧义,提高分词精度;针对现有的词典机制,提出一种改进的基于PATRICIA tree的汉语自动分词词典机制,提高了查找的速度,并降低空间复杂度和创建维护的难度;比较了各种特征提取函数,采用期望交叉熵进行特征提取,为提高分类精度打好基础;分析了两种对朴素Bayes算法进行改进的方法,指出这两种方法的实质是相同的,采用改进的Bayes算法,降低误判的风险。
其他文献
测定了红秋葵嫩果采收后在不同的贮藏温度(30±2℃、15±1℃、9±1℃、4±1℃)下外观、果重、呼吸强度、VC含量等品质和生理指标的变化。结果表明,红秋葵在14~16℃贮藏,各种指
以链霉菌CA-1菌为出发菌株,通过单因素实验和正交实验,对该菌株发酵产磷脂酶D的条件进行优化。结果表明最佳产酶条件为:葡萄糖20g/L、牛肉膏8.75g/L+鱼粉蛋白胨8.75g/L、吐温
证券信息披露制度是证券市场法律制度的核心,也是整个资本市场的基石。本文的第一部分从法理和经济学原理两个不同角度出发,揭示了国家强制上市公司公开披露证券信息的原因,并阐
脑死亡,一个异常敏感的词汇。多年来,关于脑死亡判定的讨论,早已越出了医学界的范畴,成为全社会的热点话题。
本实验通过在豆浆中添加葡萄糖酸-δ-内酯(GDL)和CaCl2并利用乳酸菌发酵生产一种新型的布丁豆腐,其质地细腻、营养丰富、富有弹性,并具有独特的豆香味。采用正交试验确定最佳
本研究的主要目的在于探讨创业动机的构成及影响创业动机的因素,并在此基础上探讨创业动机与公司经营绩效之间的关系。文章首先在大量文献研究的基础上,提出了创业动机的基本结
本文采用两因素析因实验设计,研究了转谷氨酰胺酶和四种非肉蛋白(大豆蛋白、酪蛋白、卵清蛋白、浓缩乳清蛋白)对鸡肉肠出品率和硬度的影响。结果显示,随着浓度的增加,四种非
版权作为一种受法律保护的智力成果,它包括版权所有者的人身权和财产权,其中财产权是版权金融得以实现的起点。因此,对版权金融的研究、探索与实践成为发展我国版权经济的重
集输油联合站是将油田中采油井所生产的原油汇集、存储、分离、加热脱水、计量后进行外输的生产单元。在各大油田中,联合站起着枢纽作用。然而作为石油生产系统重要组成部分的
随着人类现代化进程的加快,人类面临许多前所未有的困境问题,在深入探讨解决这些问题的过程中,人们认识到科学是一把双刃剑,它在给人类带来福祉的同时,也会带来灾难,如何使科