【摘 要】
:
随着网络技术的日益发展,物联网终端设备的大量接入,人们生活方式的智能化转变,使用的终端设备类型和数量也稳步上升。随着5G时代的到来,这种增长趋势会一直延续,并且接入终端的数量和类别在未来的一段时间内都将保持增长的态势。各种终端设备的功能、性能、价格、用户群体都不一样,分析网络终端结构,在一定程度上可以通过数据反应当前用户使用终端的情况和变化。移动运营商可以在此基础上根据用户的终端使用情况开展有差异
论文部分内容阅读
随着网络技术的日益发展,物联网终端设备的大量接入,人们生活方式的智能化转变,使用的终端设备类型和数量也稳步上升。随着5G时代的到来,这种增长趋势会一直延续,并且接入终端的数量和类别在未来的一段时间内都将保持增长的态势。各种终端设备的功能、性能、价格、用户群体都不一样,分析网络终端结构,在一定程度上可以通过数据反应当前用户使用终端的情况和变化。移动运营商可以在此基础上根据用户的终端使用情况开展有差异化的服务,引导终端结构的转变,对终端进行优化,进而推动后续业务的发展。用户终端设备识别技术是指通过搜集终端的设备信息以及运行环境信息,实现终端分类的一种技术。传统基于MAC地址的终端识别,通过获取设备物理信息完成识别,由于真实的网络环境下存在大量的三层交换机、路由器和NAT设备,需逐层部署探测软件和数据采集设备,方可获取整个网络拓扑下设备的MAC地址。这样的方法简单,但在真实的网络环境下作用有限。改进的利用终端协议栈的特征字段可识别设备操作系统类型,但这种识别方法对终端设备的识别粒度不够。与现有终端识别方式不同的是,本文主要研究的是基于网络流量数据采集分析,搜集包含终端设备的硬件信息、操作系统信息、应用程序信息、以及相关协议栈参数信息,并利用机器学习相关算法建立分类模型进行网络终端设备识别。本文主要的研究工作包括以下三个方面:首先,研究了基于分布式的高速实时网络流量数据采集、分析和存储技术。在基于开源网络分析框架Zeek(原名:Bro)的基础上,进行了二次开发,解决了高速实时网络流量的分布式采集、存储以及常用应用层协议的解析。完善了如QQ(原QQ)等协议的深度识别与解析。从协议信息字段的内容中和自身协议对应用程序的标识下,完成了对应用程序信息的识别。最后利用Python程序分析提取设备相关的User-Agent、操作系统信息、web访问记录等数据,完成了对网络终端设备指纹数据的提取。其次,基于网络流量中即时通讯应用的流量数据分析,我们提出了一种简单高效的网络NAT设备识别方法。NAT技术一方面缓解了IPv4地址短缺的问题,同时也隐藏了下层终端设备信息,NAT设备提供入网便利的同时,给非法接入提供了机会。本文提出并实现了一种基于即时通讯应用的NAT设备识别方法和系统,有效的识别出了NAT设备。识别NAT设备为进一步识别其后终端设备具体型号奠定基础。最后,考虑到不同的网络终端产生的网络流量特征会存在差异,基于网络流量特征,本文提出一种基于随机森林的网络终端设备识别模型和方法。结合NAT设备识别,完成了网络流量分析、终端设备指纹提取、训练集和测试集构建、识别模型优化等工作。最终构建出一个网络终端设备识别模型。通过该模型,给出了利用随机森林进行网络终端识别的一般步骤方法,并分析比较了该方法的优劣。
其他文献
《中国制造2025》提出把可持续发展作为建设制造强国的重要着力点。全面推行清洁生产构建绿色制造体系,应围绕绿色技术创新构造与生态环境系统相协调的新型的现代技术体系。随着命令控制型环境规制的不断加强,我国逐渐引入了旨在减少环境污染的自愿型环境规制的办法。其中作为一种自愿型环境规制的环境管理体系认证(ISO14001)是由第三方权威机构对企业实施评定从而颁发的证书,企业纳入环境管理体系认证有效的显示企
知识图谱对现实世界中的实体、概念、关系等客观事实进行建模,以图的形式表示现实世界中各个领域的知识。其中,实体、概念作为知识图谱图结构中的节点,它们之间的关系则作为知识图谱图结构中的边。目前国际上知名的开源知识图谱主要有DBpedia,YAGO,Freebase等。如何针对知识图谱进行有效查询以获取相关信息是当前的研究热点,其研究成果可应用于智能问答、推荐系统等领域,具有重要的研究价值与意义。图查询
知识经济时代,专利制度作为一种经济制度,是推动社会技术创新和加快经济发展进程最有效的创新机制。然而,由于专利价值的不确定性以及对专利权的错误运用,引发了一系列低质量的专利,也称问题专利,指的是不符合专利授予条件或者是权利要求范围过宽的专利,侵犯了专利权人的合法权益,还会妨碍正当竞争,破坏经济发展的社会秩序。另外,专利侵权现象越发严重,法院确定的专利侵权补偿规则并不能有效的解决这一问题,也不能达到预
学生在获取知识时,阅读是一种有效方式,也是他们学习的一种能力。但是,当前我们所熟悉的大多都是文科类的阅读,对数学阅读往往会选择用题海代替,由此可见,数学阅读没有得到我们的重视。伴随着文明的进步、社会的繁荣,越来越多的知识被人们所掌握,科技成果不断推陈出新,大量新奇的科技产品出现在人们的生活中并发挥出巨大作用,只靠文科类阅读,已经无法将这些科技产品阅读透彻。因此,人们开始越来越重视对数学的阅读,数学
近年来,云计算服务为企业的发展提供了更多的灵活性,推动了云计算爆炸式发展的同时,不可避免地带来了云资源的“闲置浪费”。因此,如何对云资源进行有效分配、合理定价,已经成为工业界和学术界广泛关注的议题。亚马逊EC2 Spot实例引入了云资源拍卖的概念,有效地解决了云资源的浪费问题,也大幅度降低了企业使用云资源的成本。目前的研究工作主要专注于云资源拍卖的高效性、公平性和经济效益最大化,缺少对云资源拍卖投
现代人类社会发展迅速,对各类资源消耗越来越大。陆地资源已经不能满足人类的需求,随着人类对海洋资源开发的进程不断加快,水下无线通信网络的研究变得更加重要。对于目前浅水无线通信网络来说,浅层水面和水下设备的数据传输安全防护等级较弱,仅依靠通信波形及通信协议难以保证通信安全;同时水下通信网络节点硬件部分所用芯片过度依赖国外,同样是信息安全隐患;此外现有水下通信网络节点体积较大、功耗高,仍是水下通信技术所
推荐系统从用户的交互信息中学习用户偏好,生成个性化推荐。但现有的推荐系统往往存在数据稀疏性高、可解释性差、模型训练难等问题。面对这些问题衍生了两种主流的研究方向:一般推荐算法和序列推荐算法。一般推荐算法以协同过滤及其变体作为主要内容;序列推荐算法以基于循环神经网络的方法作为主要内容。其中,序列推荐算法通过考虑用户交互的时序信息,额外考虑了用户偏好的动态变化,更符合现实生活中的实际情况。本文基于现有
随着游客对旅游需求的增长,各地开始逐渐重视起本地的旅游业发展,旅游经济发展占当地经济发展的比重也越来越大。然而在旅游业快速发展的同时也产生了许多环境问题,使旅游地的生态环境日益恶化。地质公园旅游作为近年来新兴的旅游地类型,近年来旅游情况持续火热,但与其它旅游地类型相比,对地质公园生态情况的研究相对较少,因而有必要拓展地质公园旅游生态安全研究。三清山世界地质公园位于江西省上饶市东部,是江西省热度排名
进入21世纪以来,随着控制技术、计算机技术、微型传感器技术、无刷电机技术等领域的迅速发展,多旋翼无人机因具有可空中悬停、垂直起降的优点,能适应于狭小的飞行空间,具有较
审计费用一直是国内外会计学研究领域关注的议题。就已有的文献来看,对审计费用的研究多集中在事务所特征以及被审计单位特征上,近年,随着供应链成为关注的对象,客户特征也逐步被考虑进审计费用影响因素的范畴。学术界已有相当数量文献研究客户集中度,对于其他客户特征的研究较少。本文选择客户与公司之间的地理距离作为客户特征进行研究。中国不同地区的文化特色和发展水平差距不一,同时高铁的快速发展也带动产业经济发展,将