面向DNN的多内存分布式参数存储及读写优化方法

来源 :北京交通大学 | 被引量 : 1次 | 上传用户:viviane_px349
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,深度神经网络作为人工智能领域的一部分,受到社会各界的广泛关注,越来越多的研究人员加入了深度学习的理论研究和应用研究。为了提升DNN模型精确率,样本参数以及模型参数的规模越来越大,对执行DNN训练任务的多核处理器的架构设计提出了新的挑战。目前多核处理器往往只连接一个片外内存,而处理器核的数量增多,处理器核与内存的性能存在严重的不平衡,也就是“内存墙”问题。DNN训练过程需要频繁地读/写内存中的大量参数,访存操作十分密集,“内存墙”问题的存在严重制约着DNN训练的访存操作,从而导致访存延时增加。因此本文在使用多内存的基础上,通过将DNN参数分布式存储到多个内存中,减轻单个内存的访存压力;以及通过优化内存读写方法,来降低DNN训练过程中的访存延时。本文的主要工作及创新点如下:(1)对DNN的访存特征进行了分析。通过对DNN训练过程的详细分解,得出DNN训练某一时刻的访存特征。定义了访存冲突率为单位时间内对内存操作的处理器核发出的操作数除以内存个数,得出单内存架构和多内存架构下访存冲突的比值。结合内存读写得出了单内存架构和多内存架构下的理论延时曲线图。(2)在多内存架构下,基于负载均衡分配策略提出两种不同的分布式存储方法。一种是全相连分布方式,意在让所有处理器核能够轮流访问所有内存中的数据;另一种是组相连分布方式,它将所有处理器核进行分组,每一组处理器核只能访问部分指定内存的数据。(3)在OPNET软件上实现片上网络仿真建模过程。根据对神经网络模型的硬件资源架构的设计,在OPNET上进行了网络仿真实验。实验结果表明,在内存响应读写请求序列延时相同时,DNN训练多核处理器连接多内存的架构大大降低了训练过程中总的访存延时。通过对比DNN参数的全相连与组相连分布方式,得到了组相连方式更优的结论。(4)在单内存和多内存架构仿真实验的基础上,基于DDR DRAM内存的读写特征对读写性能进行优化。结合实际DDR响应访存请求的时钟周期,本文将访存请求的时间间隔看做内存响应读/写请求延时,通过设计读写请求队列交换算法,优化了访存请求序列,从而降低了总的访存延时。
其他文献
随着城市的快速发展以及互联网时代的到来,智慧城市已成为城市建设的热点研究课题。房产是城市的基本要素之一,城市房产三维可视化是智慧城市应用的重要基础功能之一。在智慧城市的建设过程中,微观房产室内快速三维建模和大规模场景Web三维可视化一直是限制智慧城市在三维场景下的应用的技术难题。针对上述两个需求,结合Web三维可视化和深度学习等技术,本文对微观房产室内场景三维快速建模和大规模宏观城市房产可视化进行
高矿化度地层水的深层-超深层致密砂岩气藏开发过程中盐析及其诱发问题日益突出。盐析通常发生在近井地带5m范围内储层和井筒,盐析产生的结晶盐极易堵塞岩石孔喉,降低有效渗
目的第一部分:低、中、高剂量羟考酮联合丙泊酚TCI镇静在胰胆管疾病患者ERCP术中的随机双盲比较,探索羟考酮在ERCP手术镇静中的合适配伍剂量。第二部分:探索联合羟考酮时抑制
页岩气作为高效清洁的能源,已在我国四川盆地大规模勘探开发,并取得了重要突破。勘探实践证明,川南长宁区块上奥陶统五峰组—下志留统龙马溪组黑色页岩历经了复杂的深埋和抬
纵观国内炼油企业生产现状,催化裂化装置承担着全国50%以上汽油和约20%柴油生产任务,是各大炼油企业生产油品和提高企业效益的核心装置,但同时催化裂化装置的能耗也占到炼油
在现代化和全球化进程中,如何解决好文化的保护传承与现代化、全球化的关系,是全球各个国家和地区面临的共同困境。我国是一个多民族的国家,改革开放四十年来,在高速的经济增
致使移动结构(caused-motion construction)是致使结构重要的类别之一,它反映这样一种移动事实:在某种致使主体的直接影响或作用下,受事主体发生位置的改变并沿着一定的路径移动。本文基于华中师范大学语料库和美国当代英语语料库,对汉英致使移动句式进行对比性的研究,发现:汉语致使移动句式结构类型有8种,即NP1+标记词+NP2+VP,NP1+标记词+NP2+PP+VP,NP1+PP+
图像的超分辨率技术,一方面直观提升了视觉效果,另一方面也能作为其他图像处理技术的预处理手段,例如图像检测、分类和识别。将超分辨率技术应用于视频处理、医学成像、遥感技术以及安全监控等领域,既能节约大量的资源,同时也能满足实际的工程需求。许多超分辨率算法被提出用以恢复高分辨率图像,进一步改善图像可视化以便于更好地分析图像。其中,总变分正则化(TV)方法已经被证明在保留图像边缘信息方面具有良好的效果。然
高光谱图像解混是高光谱图像处理领域的重要研究方向,高光谱图像中包含了不同地物的地理分布信息及光谱信息,如何从高光谱图像中获取不同地物的端元光谱和丰度图成为高光谱图
稻瘟病菌(Magnaporthe oryzae)引起水稻病害稻瘟病,稻瘟病的发生,严重影响了水稻产量和品质,造成严重损失。稻瘟病菌作为研究植物病原真菌致病机制的模式生物,在病害发生过程