面向序列数据分析的分布式存储与计算技术研究

来源 :江苏大学 | 被引量 : 1次 | 上传用户:jtfcyy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
序列数据是大数据中快速增长的一类数据形式。不同于一般数据,序列数据中存在依赖关系,发现并挖掘其中的潜在依赖是分析序列数据的关键。当前,序列数据分析已被广泛应用于语言、音视频、金融、医学、生物、物联网、交通等多个领域,成为大数据智能研究的一个热点。除了序列数据蕴含的依赖关系具有跨度大、隐蔽深等特点外,序列数据量的爆炸式增长也使得传统的序列数据分析方法难以有效适应。以循环神经网络(Recurrent Neural Network,RNN)和长短时记忆网络(Long Short Term Memory,LSTM)为代表的循环神经网络理论上可学习任意长度序列数据中的依赖关系,是当前分析序列数据的重要方法。但在训练用于分析序列数据的循环神经网络时,涉及大量参数,还需要使用海量训练集通过大量迭代计算不断更新参数,这使得训练循环神经网络同时具有了大数据处理与高性能计算两方面的特性。因此如何针对用于分析序列数据的循环神经网络的特性,研究新型的分布式存储与计算系统,是提高循环神经网络训练效率与分析序列数据准确性的重要问题。本文首先分析了序列数据分析相关技术与研究现状,给出了当前影响序列数据分析模型训练效率和准确性的主要挑战。在此基础上研究和设计了面向序列数据分析分布式存储与计算系统的结构,为了提高序列数据分析模型的训练效率和准确性,从节点存储方法、分布式数据与元数据管理方法、以及基于分布式存储与计算的序列数据分析模型训练方法这三个方面展开研究。1)提出了基于非易失存储器(Non-volatile Memory,NVM)的节点存储方法,包括基于NVM的快速文件系统和NVM非对称访问算法。实现了原型系统,使用通用测试工具进行了测试与分析,验证了基于NVM节点存储方法能大幅提高访问数据的I/O性能、缩短访问响应时间,从而支撑序列数据分析模型参数与训练集的快速访问。2)提出了面向序列数据分析的分布存储方法,在使用分布式存储系统中元数据和数据分别存储、管理序列数据分析模型中参数与训练集的基础上,提出了元数据分级管理算法和基于NVM的数据分布管理算法。实现了原型系统,使用通用测试工具进行了测试与分析,验证了元数据分级管理算法能减少查找元数据所需的时间与空间开销、并具有很强的适应能力;基于NVM数据分布管理算法能提高读写速度和IOPS的值,为提高训练序列数据分析模型的并行分布处理效率提供了支撑。3)提出了用于分析序列数据的循环神经网络分布式训练方法,针对分析序列数据的循环神经网络训练效率问题,通过合理分布模型参数、训练集及其训练计算任务,将分布式系统中节点的计算和存储相结合,结合序列数据自身特性,分别提出了基于分布式存储与计算的自主循环神经网络、基于神经元动态激活的快速训练算法和融合时长的自适应LSTM。实现了原型系统,进行了测试与分析,验证了所提出的方法能提高用于分析序列数据的循环神经网络训练效率、分析序列数据的准确性,并增强模型可扩展性。
其他文献
自然条件下,由于风速梯度、地形地貌等客观因素的存在,风轮时刻处于偏航运行状态,偏航激振力诱发风轮不良振动,产生疲劳损坏;鉴于风力机是刚柔耦合的多体系统,风轮旋转引起塔架振动,塔架受风载、机组自重等因素的干扰也会影响风轮结构动态特性。在对风轮进行直接布点监测的过程中,风轮容易将布置在叶片上的传感器甩出,并且叶片容易与传感器连接线缠绕;在风力机行业中,对旋转运行状态下风轮结构动态特性进行实时监测、直接
财务管理课程是高职财务会计类各专业的核心主干课程,存在课程标准面面俱到、教材大同小异、教学偏重理论等问题;结合岗位需求,制定财务管理课程标准,合理定位教学目标,契合
为提高数据库系统的安全性,提出采用目前最为流行的数据库开发工具——PowerBuilder来设计开发飞机液压系统使用故障数据库系统的登录界面。详细介绍了登录界面的设计方法、开
线性规划是一种科学的数学方法,说的是用几个变量解释或评价一个变量,从而达到预测和估计的目的,其过程是提出某一理论→建立这种理论的计量模型→搜集适当数据→估计该模型
1982—1985年在淮北农田中的鼠类量调查表明,黑线姬鼠(Apodemus agrarius)数量在甘薯地中较高,捕获率为9.35%(4年合计),黄豆地中较低,为3.13%,两作物地之间存在显蓍差异(t值;2.
目的:为不同部位断足再植提供理论基础和有关数据。方法:用体视学方法对66例成人踝跖部胫神经及其重要分支进行观测。结果:胫神经的平均横径和面积分别为:第1断层5.8mm,14.1mm2,足底内侧神经的平均
伴随信息化社会的到来和发展,高职院校教育教学改革得到了深化发展,素质教育理念和各种新技术在高职教育领域得到了应用,现代教育技术成为高职院校教育发展新的创新体现,对促
研究对象与方法选择了兰州市4名中学优秀体育教师作为被研究者。在自然情景下主要采用访谈法收集相关的研究资料。对社会现象进行整体性的研究,使用归纳法分析资料并形成理论
在近几年的音乐专业高考中,出现了很多毫无钢琴基础的考生。由于这些高中生年龄和阅历的关系,一般来说,生理上已经错过了发展运动能力的敏感期,但他们知识面比较广,理解力比较强。
大气气溶胶是研究地球环境气候以及辐射特性的重要物质,它的光学参量如消光系数、后向散射系数和雷达比对于分析大气中气溶胶的粒径大小、种类、微物理参量以及研究气溶胶的