基于网站链接特征的钓鱼网站检测技术研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:swfcmoon
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
钓鱼网站主要是指一些黑客通过仿造真实网站的页面内容以此来迷惑用户进而达到获取互联网用户的一些隐私信息,如一些金融网站的账号和密码等等。根据APWG(Anti-Phishing Working Group)发布的相关报告,近年来网络钓鱼攻击不断呈上升趋势。针对钓鱼网站检测这一问题,本文提出了两种解决方案。第一种方案是在分析了传统的一些用于钓鱼检测的技术存在的一些问题,如:需要分析大量的网页内容,这就导致时间开销过大无法满足实时检测的要求,还有的检测技术需要使用到第三方服务,这就可能会因为这些服务的异常而导致检测结果失效。因此,本文的第一种解决方案只分析网站的URL特征以及第一层页面内部链接的一些特征,然后利用机器学习的方法作为检测手段,另外还结合了搜索引擎元词搜索的特点用来寻找钓鱼网站攻击的目标对象网站,该方案在能较快识别钓鱼网站的同时还能较准确的找到钓鱼网站攻击的目标对象网站。第二种解决方案的提出基于以下两方面的因素,一是考虑到一些假冒网站可能会做反爬虫机制,因而使得一些检测技术无法获得网页内容。二是通过大量分析,钓鱼网站的URL使用的一般是方便制作并且造价便宜的域名,而合法网站的域名是有一定代表意义的,使用的基本是顶级域名。因此,第二种方案只在URL的层面进行分析,该方案借用Word2vec工具使用深度学习的方法自动学习URL的特征向量表示而不需要手工设计特征然后使用机器学习分类算法达到检测的目的,该方法在1百万的数据集上实验并做相关的评测,准确率可以达到99%以上,而且检测速度在毫秒级,相比传统的一些方法无论是准确率上还是速度上都有很大的提升。
其他文献
文章介绍了氮氧化物生成机理及高炉煤气锅炉燃烧中氮氧化物污染物的控制。通过对NOx生成机理的讨论,高炉煤气燃烧时主要产生的NOX为热力型NOX,采用多层燃烧器的布置,把燃烧器组
《行政强制法》的实施将推进行政领域的全面法治。对照该法的立法精神,从卫生行政执法领域入手,具体分析了卫生行政强制领域暴露出的问题,包括一些强制措施设定的合法性及配
深圳特区报讯(记者 易东)家家证照齐全,个个店堂整洁,食品全能索证索票。7月22日,市食药局“城中村”提升调研小组在大梅沙村现场调研后,对该区域食品安全提升深表赞赏。解决了城中
报纸
现如今电力产业的发展速度突飞猛进,日新月异。众所周知,我国电力产业的发展历尽艰辛,各项技术、各项设备从无到有,在很多领域走在了世界各国的前列。现如今,无论是日常的生
纵观20世纪的外语教学史,我们看到的是一部外语教学方法的研究史。应用语言学家在教育学、语言学、心理学等理论的指导下推出了一个又一个的教学方法。从18世纪末的语法翻译法到20世纪90年代的任务教学法,每一种教学法都反映了不同历史时期的外语教学对于教学方法的不同要求,虽然每一种教学方法都各具特色,但都存在不足之处,没有一种教学方法是万能的。到了二十世纪中后期,很多专家学者对一味追求方法的潮流提出异议并
交流电机被应用于国民经济和社会生活的各个领域,其使用寿命和运行稳定性也受到了人们的广泛关注。轴承故障是电机异常工作的主要原因之一。随着电力电子技术的发展,变频驱动交流电机中存在的高频轴电流成为轴承故障的重要诱因。轴电流会使轴承表面产生电蚀坑,从而引起轴承早期失效,造成机组停运,严重时会带来巨大损失。轴承击穿过程涉及多个学科,对其研究还未全面开展。分析交流电机的高频轴电流模型、探究轴承的击穿机理并研
目的探讨蕨麻多糖(PAP)对大鼠脑缺血再灌注损伤的保护作用及其机制。方法将Wistar雄性大鼠120只,随机分为6组:假手术组、模型组、尼莫地平组(12 mg/kg)和蕨麻多糖高[160 mg/(
采用甲醇提取法和乙醇提取法从砂海星提取了海星总皂甙,其产率分别为0.12%和0.13%。产品经理化实验、溶血实验、紫外光谱、红外光谱及质谱分析鉴定,证明提取物为海星总皂甙。砂
[目的 /意义]各国政府都非常重视信息公开工作。深入调查公众个体的政府信息需求有助于政府进一步明确信息公开工作的内容和方式,提高政府信息公开工作的实施效率。[方法 /过
在国际交流日益广泛和经济发展全球化的大背景下,传统的外语人才培养模式已无法满足社会的需求,时代对复合应用型外语人才的需求日趋旺盛。从复合应用型外语人才的时代内涵和特