基于网络链接图信息的反欺诈技术研究

来源 :中国科学院软件研究所 | 被引量 : 0次 | 上传用户:ganyi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网中的网站可以通过Spam技术来提升自己在搜索引擎中的排名,从而为自己带来经济利益。但是与此同时,这些Spam技术却干扰了搜索引擎正常的排名结果,给搜索引擎带来了很大的挑战。为此,人们一直在研究算法来检测Spam技术。   本文针对如何有效检测针对网页重要程度的Spam技术进行研究。我们分析发现目前的算法主要分为基于结构信息和基于时域信息两种。本文针对目前比较流行的Spam技术,从网络链接图中设计并提取了大量的结构信息特征和时域信息特征,用机器学习的方法分别训练了基于结构信息的Spam网站分类器和基于时域信息的Spam网站分类器,并取得了很好的实验结果。   在此基础上,针对结构信息和时域信息各自的优势以及网站的多样性,本文设计并实现了一种将结构信息特征和时域信息特征结合起来检测Spam技术的方法。它根据网络链接图中网站出现情况的不同来选用不同的分类器预测网站性质,以提高预测准确率。该方法在实际的网络应用中取得了很好的效果。最后,本文通过介绍一个基于Spam网站分类器来实现的工具Spam Detector,展现了检测Spam技术所带来的优势。
其他文献
随着信息技术的飞速发展和企业信息化水平的不断提高,邮政企业内部积累了越来越多的数据。如何充分利用这些大量的数据并发现有价值的信息,为决策者提供重要的决策信息,已经成为
图像中存在的文字,为图像数据的索引与搜索提供许多的信息。如果这些文字能够被正确的定位、分割、识别,就能为基于语义的场景识别提供重要的依据。本文首先对近几年来国外的重
在面向服务的计算环境下,分布在Internet上的各类资源都可以封装成Web服务的形式,并以统一的接口规范对外发布。通过把这些相对简单且功能单一的Web服务按照特定的过程组合起来
椭圆曲线密码系统的安全性建立在椭圆曲线离散对数问题的难解性上。同其它公钥密码系统相比,它的执行速度快、密钥长度短、安全性高。移动通信迅速发展的今天,椭圆曲线密码有着
中国的网络教育随着计算机的应用与互联网的普及得到迅速发展,但目前比较流行的网上教育一般以知识呈现方式表现,是传统的以“教”为中心的教学模式。这种模式不利于全面发展学
近年来,随着智能设备尤其是穿戴设备的快速发展,基于智能设备的人体动作识别研究越来越成为当前研究的热点。基于智能设备的人体动作识别技术广泛应用在健康监控、惯性导航、行
窃听者在一定范围内通过天线接收到空间辐射的计算机视频信号,可以对计算机显示的明文信息进行还原,从而窃取涉密信息。这种情报获取方式更及时、准确、广泛、连续,使涉密信息的
学位
随着网络全球化的热潮和移动计算技术的发展,信息和系统安全成为日益严重的问题。访问控制是信息安全领域中的一个基础性的核心组成部分。基于角色的访问控制(RBAC)是目前主流
Web服务是部署在Web上的软件构件。互操作性是Web服务最值得称道的亮点,基于任何平台/编程语言的应用都可以采用标准的Imernet技术和协议方便的访问Web服务。它解决了以往分布
近些年,对基因组中“暗物质”的研究已成为生命科学及临床基础医学研究中的热点问题。2010年,《科学》杂志将基因组中的“暗物质”列为十大科学突破之榜首。2012年,“垃圾DNA”