电子邮件分类中的特征选择

来源 :计算机科学 | 被引量 : 0次 | 上传用户:kel002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
电子邮件是互联网的最重要应用之一,尽管给人们日常工作和生活带来很大便利,但也带来了一种令人讨厌的副产品一一垃圾邮件。对邮件进行分类已成为当前的一个研究热点,而如何进行邮件特征选择,是邮件分类中一个基本也是很重要的问题。本文在分析比较几种用于邮件分类的典型特征选择方法基础上,提出一种新的结合了Mitra's算法和顺序前进搜索法优点的邮件特征选择方法。实验结果表明该方法能够改进邮件分类的准确率,验证了本文方法的有效性和可行性。
其他文献
彩色纹理图像分析是图像理解和计算机视觉研究领域的重点之一,彩色纹理图像分析具有很大的优越性。本文提出了一种新的彩色纹理图像描述子,首先计算RGB向量空间的梯度,经过标准化后把它映射到灰度级上,利用共生矩阵来描述纹理图像特征,并用于图像检索。实验结果表明,该纹理图像描述子能够有效结合颜色和纹理特征,具有良好的检索效果。
如何在复杂多变的环境下实现对应用系统软件的快速设计和升级,已成为软件开发所关注的基本问题。提出了有效的应用系统设计模型,它能够将应用系统抽象成表单流、数据流和事物流
随着我国移动通信事业的快速发展,运营商越来越重视无线网络规划与优化工作,侍播模型是移动通信网中小区规划的基础,根据给出的传播模型经验公式,提出了具体的解决方案,设计了相应
在分析不一致不完备信息系统规则提取的基础上,提出了先将不完备信息系统分为一致的和不一致的信息系统后再求其最优选择的方法。然后利用改进的分辨矩阵对所求得的不一致最优
业务模型的复杂度决定企业信息系统的复杂度,也对信息系统的重构性能具有很大程度的影响。目前研究多侧重于代码级软件的复杂度度量,而对业务模型的复杂度则关注较少。本文首先
本文分析了基于EDI和XML技术的电子商务系统应用集成问题,描述了一个EDI-XML通用数据转换构件系统的设计原则和软件架构,论述了该架构方案中EDI-XMI。数据模式的定义机制,提出了
诠释(annotation)是JavaSE5引入的一种新的编程语言成分,目前得到广泛关注。但从可视化建模来看,已有的Java元模型和UML2元模型并不支持诠释规范,这导致诠释的语义特征在高层抽象
随着网络上光盘资源的增长,光盘服务器成为光盘网络共享的重要技术.针对传统光盘服务器的缺点,设计并实现了一个基于iSCSI协议的高性能集群光盘服务器CCS(Cluster CD Server).CCS
现代企业日益强化企业信息系统的开放性、可重用性和可伸缩性。本文针对当前企业信息系统研发中的一些问题,在将企业信息系统可被抽象表示为“用户在安全控制下对受控实体的一
本文提出一种基于动态哈希树的流量跟踪算法DHT(Dynamic Hash Tree)。该算法利用网络会话的长时稳定性,动态搭建一个由多哈希表组成的树,以提高实际网络环境中会话识别和流量跟踪