基于用户兴趣集的在线垃圾邮件快速识别新方法

来源 :电子学报 | 被引量 : 7次 | 上传用户:sfyaa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为在不显著降低垃圾邮件识别精度的同时有效提高邮件识别速度,提出了一种在线垃圾邮件快速识别新方法.首先引入用户正、负兴趣集的概念,结合用户兴趣集及支持向量机对邮件进行分类;然后根据主动学习理论,结合训练集样本密度及改进角度差异方法寻找分类最不确定的样本并推荐给用户进行类别标注;最后将标注后样本及分类最确定性样本加入训练集,并使用样本价值评价新函数淘汰冗余样本以生成新的训练集.实验表明,本文方法的用户标注负担小,垃圾邮件识别精度高、速度快,具有较高的在线应用价值.
其他文献
随着社会的发展以及新的治理模式的出现,现有的评估主体由于其评估主体的单一、评估方式的单一、评估结果运用的唯一性越来越显示出其困境。基于此,合作治理必将成为政府绩效评
本文提出了一种适用于IEEE 802.15.4标准的2.4GHz免认证ISM频段的全集成CMOS射频收发机.接收机采用低中频结构以降低功耗、提高灵敏度,发射机则采用直接上变频结构以降低设计
针对美国新奥尔良地区稀疏的LiDAR(Light Detecting and Ranging)点云数据,提出了一种基于LiDAR数据和卫星图像进行融合的居民区建筑物重建方法.该方法利用LiDAR数据点集的边界来定位卫星图像上的感兴趣区域,利用从感兴趣区域中提取的关键提示线来实现屋顶的分割,从而得到属于每个建筑物的屋顶点.然后,基于三角面片的法向量方向信息对其进行聚类,根据法向量之间的关系进行屋顶类
为模拟一般Davidson-Cole色散媒质中的电波传播,本文提出了一种时域有限差分(啪)改进方案,改进之处体现在:(1)适用媒质从单极推广到多极情形;(2)适用媒质从无磁推广到有磁情形;(3)保留了色
从扭转市场国外化倾向、科技创新体系、教育创新体系、龙头企业优势和配套产业等视角对县级光伏产业的发展进行了探讨。
本文基于Maximum Distance Separable(MDS)码的Hamming重量分布提出一类新的二元Alternant子类码.分析表明这类新的子类码包含整个BCH码类,并且可以渐进达到Gilbert-Varshamov(G
结合广西制糖机械设备的现状及应用情况,对改善我国制糖业现状的对策进行了深入探讨。希望通过本文,能为国内制糖机械设备的下一步技术改造及安全稳定使用提供帮助和参考。