【摘 要】
:
随着互联网不断的发展,我们生活的各个方面都有网络的存在。尤其伴随着移动设备的推陈出新,互联网用户数量越来越多。伴随着互联网用户增长的是巨大的网络数据流量。通过对网
论文部分内容阅读
随着互联网不断的发展,我们生活的各个方面都有网络的存在。尤其伴随着移动设备的推陈出新,互联网用户数量越来越多。伴随着互联网用户增长的是巨大的网络数据流量。通过对网络流量进行分析,可以对的互联网数据造成网络的拥塞进行告警。不仅如此,数据流量分析还可以对用户行为进行分析,进而为用户提供更加准确有用的服务,提高用户的上网体验。在数据流量分析中,数据流量采集作为数据分析的第一步,同样也是原始流量的入口部分,其采集精度对后续数据分析的结果有直接影响。对数据采集流量系统而言,其主要功能大概分为解析现网报文,对相同类型报文进行匹配以及将结果以格式化的话单形式输出。在报文匹配的过程中,以五元组作为匹配标识,使用哈希表的数据结构快速查找,将相同五元组的报文数据匹配在一起。为提高数据流量采集系统的采集精度,本文设计了一系列的优化方法提高哈希处理速度,减少报文丢弃。首先,为了能更好的量化哈希表性能,本文分别针对哈希函数和哈希表冲突处理提出两种评价方法。然后,通过调研原始采集系统哈希机制,分析可能出现的报文丢弃场景。分别对每种丢弃场景进行分析,得到采集系统哈希表丢弃原因。针对不同的丢弃原因,本文设计了多种优化方案减少报文丢弃,并对各优化方案进行了横向比较,查看优化效果。随后,本文分析了哈希内存占用对采集精度的影响。为使得采集软件能在尽量小的内存占用中获得令人满意的采集精度,本文总结了开链法哈希的链长分布规律,并根据所得规律制定哈希优化方案。最后,论文对采集系统哈希优化的研究成果进行了总结,并对未来的研究方向进行了展望。
其他文献
犬瘟热病毒(CDV)、犬副流感病毒(CPIV)、犬细小病毒(CPV)和犬腺病毒Ⅱ型(CAV-2)是引起犬常见传染病的主要病原体,给养犬业带来了严重经济损失。本研究根据四种病毒在GenBank
东海陆架盆地西湖凹陷,以渐新统花港组为研究目的层。在层序地层学理论的指导下,结合国内外年代地层、岩石地层、生物地层、地震地层、层序地层、沉积相以及储层研究现状,在
由于深度神经网络在越来越多的任务中展示出卓越的性能,研究人员试图将其应用到更加具体的任务中去,如相机重定位。目前基于传统几何结构的相机重定位方法的性能很大程度上取
市场经济的发展,带动了多种经营主体的繁荣,中小企业作为国民经济当中的重要成分,创造了大量的就业机会,同时为人们的生活提供了便利的条件。但是在当前的市场经济下,中小企
在通信技术和网络技术飞速发展的今天,传真通信以其实时性强、安全可靠、传真文件具有法律效力等特点,仍广泛应用于日常工作与生活中。随着现代社会信息交流越来越频繁,传统的传真机已经跟不上时代需求并逐渐被传真服务器及基于传真服务器的网络传真设备所取代。网络传真方式需要将传真上传至第三方服务器,在一些场合并不适用。国内生产的传真服务器中使用的传真相关技术主要以国外公司垄断的调制解调芯片实现,但是芯片升级每次
脆弱性是社会-生态系统三大属性之一,近年来脆弱性研究越来越成为学界关注的热点。农户作为乡村社会-生态系统的主体和乡村最基本的经济单位,其生计容易受到系统外部因素的冲
目的:了解新型冠状病毒肺炎疫情对一线医护人员心理状况的影响。方法:采用症状自评量表(SCL-90)对湖北省武汉市收治新型冠状病毒肺炎重症患者的定点医院的一线医护人员进行量
中国快速城镇化所导致的城市用地空间拓展与土地资源紧缺的矛盾使城市发展模式从注重新增建设用地开发向注重存量建设用地再开发模式转变,城市更新成为我国转型期城市发展的
目前,我国公交运营公司在公交调度上主要是依据以往的人工经验去排班,这样的排班不仅有很大的繁琐性而且也不能提高公交运行效率。本文将利用公交大数据,实现公交调度排班优化。公交调度排班优化能适应人们的出行规律,疏通人流,提高公交的运行效率,吸引越来越多的人选择公交出行。本文首先对乘客的IC卡数据信息进行数据源分析和数据预处理。利用这些数据挖掘和提取出每个线路上乘客的客流量情况,对乘客的出行时间分布进行分
党的十八大以来,习近平同志把敢于担当纳入新时期好干部标准,强调党的干部必须坚持原则、认真负责,面对大是大非敢于亮剑,面对矛盾敢于迎难而上,面对危机敢于挺身而出,面对失