面向高并发数据访问的并行I/O性能优化机制研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:lxkef
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在当今大数据时代下,很多科学计算应用正从传统的计算密集型向数据密集型模式进行转变。在这些科学计算应用中,多个进程同时访问一个共享文件是一种非常常见的并行I/O访问模式,其I/O性能始终是制约并行程序运行效率的一个重要因素,为了提高程序性能,针对这种访问模式进行I/O优化的MPI-IO库被广泛采用,得到了良好的效果。与此同时,为了适应大数据存储与访问需求,诸如Lustre等并行文件系统也被越来越多地部署在高性能计算环境中,这为传统并行I/O中高并发数据访问优化带来了新的挑战。为了解决新环境下面临的并行I/O性能问题,面向高并发数据访问的并行I/O性能优化系统,通过采用将应用I/O访问模式与数据物理布局相匹配的设计思路,重新组织I/O请求顺序,使得I/O代理进程与I/O节点之间形成“一对一”的匹配模式,从而减少高并发数据访问时的数据访问竞争。该优化系统先通过获取分析应用I/O访问模式,从而将其转换成数据物理存储访问信息。然后综合两者信息,设计实现优化的代理进程选择方法与文件域划分方式,使得各I/O节点都能保证均衡的I/O负载,同时将待访问的文件数据段按锁边界对齐,减少锁竞争的发生。最后对I/O请求进行重新组织调整,得到最优的请求顺序,从而保证将一个大的数据请求分成若干子请求时,在完成每个子请求的迭代过程中,不会产生资源访问竞争。这种基于迭代过程这一更细的并行粒度的优化策略,为I/O请求重组织提供了更高的灵活性,保证减少数据访问竞争的同时,不会引入额外的进程间通信开销。基于Lustre分布式文件系统和MPI-IO访问模式的实验测试结果分析表明,该优化系统与传统的优化策略系统相比,在不同的中间缓存大小、条块分布的存储对象设备数量以及计算进程数量条件下,对高并发数据访问的并行I/O性能可以达到平均30%以上的提升效果。
其他文献
数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程,其主要目标是从大型的数据库中挖掘
学位
网络教育突破了传统教育制度和模式的束缚,是教育体系发展过程中的一次重要变革。人们通过网络教育可以轻而易举地获取知识,从而参与公平竞争。网络课程具有交互性、共享性、开
随着信息技术的不断发展,XML规范已经得到普遍接受和应用,如何更高效地查询XML文档中的信息也已成为学术界和工业界的研究热点。目前的几种XML文档查询技术中,基于索引的全文检
固态硬盘由于存取性能高、能耗低的优点不断被普及,利用SSD+HDD搭建分层的混合存储系统被不断开发和利用。然而由于SSD受到写次数的限制,具有一定的使用寿命和可靠性问题。如
生物特征识别是一种利用个体生理特征来对个体进行身份鉴定的技术,指纹由于其唯一性和终生不变性特征而成为理想的个体身份鉴定依据。近年来,随着计算机与信息技术的发展,指纹识
我们已经进入一个信息革命的新时代,这个信息时代的显著特点是计算机在人类生活的各个方面,起着越来越大的作用。自然语言是人们最重要的交际工具,它与信息处理有着十分密切的关
射频识别(Radio Frequency Identification,RFID)就是利用无线电收发技术实现对物体的自动识别,是过去十年中发展最快的自动识别技术。RFID是一项流程控制技术,能为制造业、物流
约束优化和动态优化都是优化问题的主要研究领域,并且由于实际约束优化问题和动态优化问题非常复杂、困难,在实际应用中也非常普遍,所以解决约束优化和动态优化问题是非常有
互联网的数据变得越来越庞大,如何自动地从中抽取信息从而减轻人类的阅读理解负担变得越来越价值。互联网的网页中主要包含三种类型的文本——结构化文本,半结构化文本,自由文本