基于链接相似度和作弊系数的Spam网页识别算法

来源 :2015中国计算机应用大会暨2015年大数据与物联网在工业中的应用会议 | 被引量 : 0次 | 上传用户:obzz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Spam网页主要通过链接作弊手段达到提高搜索排名而获利的目的,本文根据链接作弊的特征,构建链接相似度和作弊系数的评价指标,研究出Spam网页的识别算法.借鉴BadRank算法思想,从Spam网页种子集合通过迭代计算链接相似度和作弊系数,并根据与种子集合的链接指向关系设置权重,将待判定的网页进行度量.最后选取Anti-Trust Rank等算法作对比实验,结果验证了算法在准确率和适应性方面优于对比算法.
其他文献
北海新力实业股份有限公司:你公司报送的配股申报材料收悉。根据广西壮族自治区证券委员会办公室《关于北海新力实业股份有限公司1999年度配股申报材料的初审意见的报告》(
日前,世界羽联为林丹发放了一张宝贵的外卡,林丹因此得以参加今年8月在广州举行的世锦赛。此前,由于在伦敦奥运会后休整了大半年,期间绝迹国际赛场,林丹的世界排名从之前的第
  测井是快速和准确获得岩性信息的最主要途径,岩性识别是测井数据解释中最关键的一环。随着随钻测井技术的发展,研究和发现速度快,识别准确度高,泛化能力强的岩性自动识别方法
对传统上“男强女弱”的马来西亚羽毛球队而言,因整体实力输人,所以苏迪曼杯混合团体赛一直都不是他们的目标。然而这次占据了天时地利人和,首次成为苏杯东道主的马来西亚不
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
羽毛球训练中,以多球训练最为简单实效。可以根据需求,模拟不同的速度、强度和打法类型,对运动员进行针对性的训练。双打训练中,可以针对进攻、防守或轮换进行强化训练。本节
2007年,受美国次贷危机等因素影响,世界经济增长速度有所放缓,但国际贸易仍较活跃。步入2008年,世界经济和贸易增长速度进一步放缓,我国对外贸易环境趋紧,不确定因素还在进一
  构建了智能电网家庭能源管理系统中的机对机(Machine-to-machine,M2M)网络架构,查阅智能电网中通信技术的主要文献并进行了分析。首先设计一个智能电网M2M 通信的网络模
交通信号灯的识别是实现无人驾驶车载视觉重要的一步.本文提出一种基于先验知识和优化阈值分割的交通灯识别算法.该算法利用差分GPS信息和道路标记软件获取交通灯先验知识;在
随着教育理念的逐渐进步,在小学教学中,愈发强调对学生的心理健康教育.对于低年级的学生而言,班主任对他们开展的心理健康教育,能够让他们在初步进入学校之初,就建立起有利于