基于Tor的暗网软件架构与数据分析研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:true51
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络通信技术的不断发展,互联网的规模变得愈发庞大。现今互联网可分为表网与深网两部分,在深网中还包含有一个被称为暗网的子集,其必须通过匿名通信系统方能访问,并且能提供深网所不具备的匿名性。基于匿名通信系统Tor构建的暗网是现今规模最大的暗网实体,其本质是以Tor隐藏服务的形式承载的。Tor隐藏服务允许服务方在提供网络服务时隐藏自身的物理位置,这种强大的匿名性使得Tor暗网中充斥着大量不受监管的敏感数据。因此,实现Tor暗网的合理监管迫在眉睫。首先,本文对匿名系统Tor的通信原理及相应机制进行了分析介绍,并从Tor暗网服务发现、数据采集以及数据分类三个方面归纳总结了当前学术界针对Tor暗网数据分析展开的研究工作及成果。其次,本文对Tor暗网的软件架构进行了研究,并以此为基础,提出了基于Tor的暗网服务发现方法TWSD。本文对Tor暗网服务的设计进行了分析,指出了当前暗网服务存在的设计缺陷,并利用该缺陷对TWSD方法的架构进行了设计。TWSD方法通过部署受控隐藏目录服务实现服务发现,优化了服务发现资源高消耗的问题,同时针对暗网服务审查机制实施了规避策略。随后,通过实验验证了 TWSD方法仅需部署16台受控隐藏目录服务即可实现非公开洋葱域名的高效获取,并能有效规避暗网服务的审查机制。最后,本文针对Tor暗网敏感数据收集难、分析难的问题,设计了基于Tor的暗网敏感数据分析方案TDSA,并对该方案的总体架构、关键模块设计以及代码实现进行了详细阐述。在暗网元数据采集中,针对单例洋葱代理链路高负载引起的采集效率低下的问题,提出了基于暗网请求报文的负载均衡策略。在暗网敏感数据特征提取中,针对TF-ICF算法存在的局限性,提出了基于暗网页面位置的TF-ICF改进算法。随后,通过实验验证了 TDSA方案能够实现暗网敏感数据的自动分类,分析了不同类别敏感数据间存在的关联关系,并设计对比实验证明了TF-ICF改进算法能够提升暗网敏感数据分类的效果。
其他文献
随着在线社交网络的迅速发展,在线用户信息的数据量呈爆炸式增长,如何从数据中提取有用的信息并利用这些信息为用户提供个性化的推荐逐渐成为研究热点。目前已经涌现出了许多向社交网络用户推荐符合他们兴趣的信息的个性化推荐系统和方法,然而传统的单域推荐方法通常会受到信息稀疏性问题以及推荐冷启动问题的影响,对稀疏性以及冷启动问题的解决能力是有限的。由于互联网用户通常会接触多种不同类型的社交网络,结合网络间信息进
视频直播服务广泛进入到人们的日常生活中,拥塞控制算法承担着根据网络状况及时调整速率的任务,对于保证用户体验起到了重要作用。但是面对复杂多变的网络环境,拥塞控制算法面临着巨大考验。学术界对此引入了机器学习等方案解决此问题,但基于仿真器的设计,与真实环境仍然存在难以适配、表现差的问题。本课题依托合作方直播平台数据,通过结合线上实际表现,使用线上真实数据,验证了基于规则的GCC拥塞控制算法和由仿真训练的
虚拟现实(Virtual Reality,VR)技术普及率日益增长,虚拟现实内容快速增长,虚拟现实技术未来具有广阔的发展前景。但是虚拟现实应用在带宽,延迟和数据包丢失方面对网络性能提出了独特的要求和挑战。本文根据虚拟现实基于视口(FieldofView,FOV)传输的特点,在无线家庭网条件下,针对单用户场景和多用户组场景这两种高频应用场景,就如何在有限的网络资源下充分利用信道带宽,减少冗余数据传输