针对地震大数据的分布式文件系统的研究与设计

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:seair123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现代社会随着科学技术不断地进步发展,互联网的不断普及,人们逐渐了解了云这个全新的定义。伴随着云时代的到来,大数据也同样进入了人们的视线。信息技术的长足进步,大数据的应用已涉及到了社会的各行各业。其中在地震勘探方面,为了满足社会的需求,地震勘探所产生的数据量也在大幅增长,海量数据的产生虽然很好地反映了社会对石油、天然气等资源的极大需求,但是大规模的数据的处理问题也给地震勘探行业带来严峻的挑战。地震勘探产生的海量数据所带来的问题是多方面的,包括存储、读取、冗余、抽取等。本文重点针对数据的存储与读取两个方面。在实际情况中,读取地震数据需要考虑用户的具体情况,满足用户的需求,这一般体现在读取数据的速度和效率方面,同时还需要考虑到地震数据本身的特点。本文针对这些方面设计了一种架构,采用分布和分级的策略。分布即对地震数据的分布式存储:把大量的地震数据分散到各个存储节点进行存储,同时通过一个主节点对这些数据节点进行管理;分级即数据的分级查询:从主节点到数据节点,分级地对所需要的数据进行查询,进而得到用户所需要的数据。本文在此架构的基础上,针对地震勘探数据本身的存储格式即SEG-Y格式,以该格式为基准,对地震数据的存储格式进行了改进,并与原SEG-Y进行对比,结果表明在一定程度上提高了效率。除此之外,本文基于此架构加入了两级索引结构,通过索引快速找出数据存储的位置并进行读取,保证了用户读取数据的需求。这是本文基于分布分级策略的相关实现细节,也是本文的创新之处所在。针对以上几个方面的研究,本文以目前比较流行的两种分布式文件系统Fast DFS和Hadoop DFS为载体,结合地震数据本身的特点以及对IO性能的需求,把前文提出的分布与分级式的策略融合进这两个分布式文件系统中,使其在地震数据的性能方面能发挥出应有的优势。然后在此基础上对文件的操作进行测试并与原有分布式文件系统进行性能对比,测试与对比结果表明,本文设计出的分布式文件系统在对地震勘探数据的处理是十分合适且高效的。由于本文设计出的系统对于地震数据的操作具有一定的优势,并且操作方便也更加人性化,所以在实际的地震勘探行业中的应用前景也是十分广泛的。
其他文献
背景:全髋关节置换术(total hip arthroplasty-THA)目前正在被越来越广泛的用于治疗成人发育性髋关节发育不良(developmental dysplasia of the hip-DDH)并逐渐成为中晚期DDH的首
创作悲剧,是20世纪80年代女性作家心理能量的释放,是她们内心精神的裸露,是她们心灵的独白。但这些作品的情感基调却并不是灰色的、消极的,而是积极、健康而又满载着女性作家
<正>器乐教学是中小学音乐课堂教学的重要组成部分,是学生学习音乐、进行艺术实践、表现音乐和创造音乐的重要手段。但由于长期以来受"音乐课就是唱歌课"的思想的影响,有不少
调整结构转型发展是县域经济发展突破资源环境制约、提高质量效益的根本路径和迫切需要。在推进区域经济转型发展中,应加快传统产业优化升级,夯实转型发展基础;培育发展战略
目的:了解吉林省居民对短暂性脑缺血发作的认知状况,以及影响认知状况的影响因素,从而采取相应措施来改善人群中短暂性脑缺血发作认知状况,降低短暂性脑缺血发作危害。方法:按照多
20世纪70年代以来,各国逐渐以金融深化来促进经济的发展,利率市场化作为金融深化的核心,也成为各国发展金融市场的主流趋势。随着中国利率市场化改革的不断深入,市场对利率的
<正>从智能终端发展情况来看,终端设备+云处理+软件+服务的发展模式将成为企业发展的核心,一个被智能终端裹挟着的世界在2013年打开了一扇窗。2013年被喻为可穿戴设备元年,从
目的:本文旨在研究急性失代偿性心衰(ADHF)患者血清神经元特异性烯醇化酶(NSE)水平的变化及其对ADHF患者预后的影响。方法:连续入选474例住院ADHF患者,抽取入院第二天清晨空腹静脉血
纳米材料由于其特殊结构而拥有一系列独特的物理、化学性质。金纳米颗粒由于其独特的化学与物理性质使得其适用于设计新产品和改进传感设备,尤其适用于电化学传感器和光学传感
小微企业是我国国民经济非常重要的组成部分,小微企业在我国经济社会发展中起到了致关重要的作用。小微企业作为活跃经济社会活动中的基本单位,寄售了大量社会劳动就业人员,