数据网格中数据复制的研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:zoudehenhao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网格计算是一个广域范围的分布式计算环境,它包括地理位置不同区域上的个体或协会这些协作者之间大规模的资源共享,这些协作者通常被称为虚拟组组织。数据网格是一种以传送和管理海量科学数据并且用于科学分析为为特定需求的网格基础设施。处理大量数据的科学应用和数据网格技术潜在受益的例子包括高能物理、天文学、生物信息学以及地球科学等。本文中,我们首先对与复制技术有关的研究成果进行了总结。特别是集中于已经提出的用于数据网格环境的数据副本放置策略。对于每一个副本放置技术,我们考虑它的方法、目标和结果。这些策略通过有关底层的网格拓扑结构,用户的请求模式,数据集的大小以及数据的分布、节点的存储能力等方面的假设有所不同。其他特点包括副本被放置到网格节点的数据请求路径和数据请求方式。面对树结构和别的体系结构之间变化多样的特征,找到一个共同点用于比较不同的复制策略是非常困难的。因此,我们把拓扑结构分为树结构和混合/P2P体系结构,并且分析在每一种体系结构下副本替换策略的影响。一个混合的拓扑结构能够具有树结构和P2P结构的特征,并且能够被用来获取一个复制策略的较好性能网格环境中数据复制的主要目标是通过把数据副本放置在接近用户的位置来加强数据的可用性,这样就可以最小化用户的感知响应时间。对于分等级的数据网格,副本通常以自顶向下或自底向上的方式来放置。我们提出了一种两路副本放置模式,它可以把最常用的文件副本放置到距离请求客户端近的位置,把不常用的文件副本分层放置到数据网格根节点下面。由兄弟结点和父结点来为数据请求提供服务。另外一个有趣的、和数据网格中文件副本放置有关的问题是副本服务器之间的负载共享。目前大多数的技术都是选择候选结点用于副本放置,这些候选结点具有最大的文件访问请求。但是,在访问负载和存储负载的基础上选择候选结点有可能产生更加有效的负载平衡复制策略,于是,我们提出了一种方法,称为公平-共享复制(FSR),它在分级的数据网格中放置任何副本之前需要考虑数据请求的数量和候选结点的存储负载。本文所提出的技术是通过使用GridNet系统来模拟实现的,GridNet系统的研制是为了用来评估数据网格中的复制策略。通过高能物理实验中有关数据网格环境的不同参数的设置来测试两路策略和公平-共享复制策略,性能结果说明了他们的有效性。数据网格环境的不同的设置是指用户访问模式,数据集大小,和服务器存储能力约束。
其他文献
利用Mathematica软件的可计算文档格式可以实现动态可视化教学。该功能简单易用,可以直观形象地展示化学反应器、复杂化学反应体系和分离过程中因变量随自变量变化的趋势。软
随着互联网带宽的增长和新型互联网服务的发展,爆炸式增长的在线多媒体数据和蓬勃发展的社交网络给互联网广告的发展带来了全新的挑战。传统的基于文本数据挖掘的广告上下文
结合〈中医基础理论〉教材设定与教学情况,在不同章节重点采取相应的教学方法,达到较好的教学效果.
通过对理论课程考试成绩、对毕业生参加执业助理医师资格考试合格情况统计处理及对学员在理论水平、诊疗能力、操作技能、社会评价等方面提高情况调查问卷及召开学员座谈会等
在Peer-to-Peer(P2P)覆盖网络系统中,都是通过各个终端结点之间相互协作,以达到利用终端结点各类资源。对于带宽密集型应用如P2P流媒体直播应用而言,主要是利用终端结点的带
目的:治疗后房型人工晶体巩膜缝线固定术治疗小切口非超声乳化白内障术中,后囊破裂无后囊膜支撑的无晶体眼。方法:人工晶体单襻睫状沟经角膜进针缝线固定。结果:术野清晰,操
利用网络编码(network coding NC)可以使通信网络的吞吐量达到网络容量的最大值,因此目前网络编码被认为是未来网络技术发展的一大方向。根据数据编码的方式不同,网络编码可
目的探索肝源性腹水的处理方法。方法通过中心静脉导管引流治疗22例肝源性腹水并观察其疗效及副作用,评诂中心静脉导管引流在肝源性腹水治疗过程中的意义。结果显效13例(59%),
在土建结构工程设计过程中,优化设计具有极其重要的现实意义。文章分析了数学规划法和优化准则法两种设计优化方式,并以此为基础,进一步探究在土建工程结构设计时如何更为有