分布式存储数据下的半监督学习算法研究

来源 :西南大学 | 被引量 : 0次 | 上传用户:lxting86
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的进步,人类社会正在进入大数据时代,海量的数据正在源源不断地产生,通过对这些数据的分析统计,能够获得很多极具价值的信息。通过合理的分析利用这些信息,能丰富便利日常生活,也促使其他技术共同成长。大规模优化问题在很多数据敏感型机器学习领域都十分常见,在这些问题中,往往数据量和数据维度都非常大。例如数据挖掘、环境监测以及遥感等领域。在这样的环境下,由于计算机计算和存储能力的限制,只依靠单一计算设备进行数据的处理是不太现实的,因此需要多台终端设备共同合作处理数据完成预期的任务,这就催生出了分布式学习的概念,即多台逻辑上或是地理上分布的设备通过合作共同处理同一个任务。另外,通常数据的采集也不是在同一个地方完成的,而是不同的采集设备分布式地将采集到的信息存储在本地。并且出于通信代价和储存代价的考虑,通常也不会考虑将大量的数据信息集中存储起来。例如无线传感器网络中传感器采集到的数据。或者出于隐私保护的考虑,将收集到的信息独立存储且不进行共享。例如银行系统中,不同部门存储的用户数据信息等。由于数据的存储和分析处理都是分布式的,所以研究有效的分布式信息处理算法是很有必要的。本文将针对横向和纵向分区的情况分别提出相应的分布式半监督超限学习机(DSSELM)算法。所谓横向和纵向分区是指数据集的存储情况:横向一般是在数据量比较大的情况下,每个节点存储一个总数据样本的本地子集,而纵向一般是在数据维度比较大的情况下,每个节点存储所有数据样本的某几个维度的特征信息。在分布式场景下,整个模型构建在一个通信网络上,每台设备被抽象为网络中的节点。在横向分区数据的情况下,网络中的每个节点都被赋予一个单隐含层前馈神经网络(SLFNN),在算法的每次迭代过程中,通过利用本地训练数据以及与其直接通信的邻居节点发送来的信息来合作地更新模型参数,来解决半监督超限学习机(SSELM)问题。其中,为了获取整个数据集的样本关系信息(拉普拉斯矩阵),提出了一种自适应更新的锚点图方法来计算全局的拉普拉斯矩阵。在纵向分区数据的情况下,与前者不同的是,由于每个节点存储的样本特征并不完整,无法构成一个完整的SLFNN,因此通过分析隐含层节点的输出的计算公式,我们将一个完整的SLFNN拆分,每个节点只包含整个SLFNN的一部分。经过这样的处理便可以在不发送原始数据的情况下完成SSELM的训练问题。另外,针对纵向分区的情况,首先提出了中心式的算法,即有中心节点存在的情况,然后在此基础上推导出了完全分布式的算法。最后通过实验仿真验证了所提出算法的有效性,并且与已有算法做出了比较。首先对于横向分区的数据集情况,对合成数据集“双月”数据集做了仿真,而对于真实数据集情况,选取了MNIST数据集进行仿真实验,试验结果表明所提出的算法能够收敛到基于整个数据集训练得到的模型的精度。对于纵向分区的情况,只进行了真实数据集的仿真,分别是MNIST数据集和信用卡评级数据。实验结果表明在不交换原始信息的情况下,所提出的算法能通过协同估计计算出相应的模型参数,并且达到与集中式算法相同的精度。
其他文献
随着新课程改革的推进,语文教材也不断变革。由于古诗文承载着丰富的知识,蕴藏着深厚的文化,对提升高中学生语文学科核心素养以及继承弘扬中华优秀古代文化具有重要作用。2019年最新出版的部编版高中语文教材中古诗文所占比重明显增加,这也对学生的古诗文学习提出更高的要求。古代文化常识不仅是学生需要掌握的语文知识,而且对解读古诗文具有重要作用。因此,系统了解古代文化常识有助于加深学生对古诗文的理解。目前,语文
初中道德与法治课是为初中生思想品德健康发展奠定基础的一门综合性课程,这是一门综合的德育课程,是培养学生的正确的价值观和民族观,每一个中国公民都需要从中找到学习的真谛,培养个人的素养以及责任感。维吾尔族作为新疆传统且具有悠久历史的少数民族,初中生的道德与法治教育必不可少,因为他们是未来新疆各项建设的中坚力量,提高他们的爱国意识,反对分裂主义,为促进国家经济稳定,促进新疆地区的发展起到关键性的作用。本
课堂教学过渡语是教学语言的一个重要组成部分,它有利于教学的衔接和连贯,在整个教学设计和教学过程中尤为重要。《教师语言行为规范》一书中提到,教师的口语应该“富有条理感和层次感”。这对课堂过渡语的设计和使用提出了要求。同时,《义务教育语文课程标准》中的“教学建议”部分提到,教师“应该根据不同学段学生的特点和不同的教学内容,采取合适的教学策略”。这启发我们依据不同的文本体裁设计语文课堂教学过渡语。因此,
随着生产力、科学技术的生产与发展,当今人们越来越享受机械带来的便利并依赖各种机械化为我们创造的财富,然而自古以来的传统手工性绘画也必然随时代的发展而发生变化。艺术家通过操控机械来进行绘画的方式随着机械化社会的到来应运而生。在中国,同样有利用机械来绘画的艺术家,例如,中央美术学院教授孟禄丁,孟禄丁在绘画创作过程中主张“破”和“过程”的艺术观念,“破”即打破,例如打破原本的绘画方式,思维方式等,故孟禄
面部表情识别技术作为非接触式人机交互技术,已经成为神经科学、情感学、认知心理学等学科的热点研究方向,并且在辅助治疗、教育、零售、安全驾驶等领域具有广阔的发展前景。本文以深度学习原理为基础,在研究原始胶囊网络的基础上,根据自然环境下表情图像的特点,提出了基于多尺度特征胶囊网络表情识别算法,并在网络中引入注意力机制来自适应学习特征图通道的重要性。本文的主要研究内容及成果如下:(1)研究了卷积神经网络和
随着学科核心素养进入教育视野,本土文化的开发和利用,在初中《道德与法治》教学中日益成为热点。本土文化是人们在长期的历史奋斗中留下的宝贵精神财富,与中华优秀传统文化和社会主义核心价值观一脉相承,与时代精神共同进步,是当地人们精神的眷恋,代表着当地人们独特的精神标识。作为思政教师,用优秀的文化培养人,能塑造学生正确的人生观、价值观和世界观,以文化人,创造性地开发利用好本土文化,更好地延续本土文化血脉,
习近平总书记对当今时代形势作出重大战略判断:“当前中国处于近代以来最好的发展时期,世界处于百年未有之大变局,两者同步交织、相互激荡”。教育是民族振兴、社会进步的基石,党的十八大首次将“立徳树人”确立为教育的根本任务,要全面落实这项根本任务,让广大青年既有真才实学,又能不断增进个人道德修养、社会担当。高中阶段是新时代青年人思想道德素质养成的关键阶段,这就对新时代高中生的思想道德素质发展提出了新的要求
未来的世界是人才的世界,人才的世界需要梦想,梦想的实现需要教育。国家的发展离不开资源,最大的资源就是人才。我国已经实现了第一个百年奋斗目标,为了实现第二个百年奋斗目标,就需要注重人才的培养,以此为实现目标的重要方向,只有这样才能实现中华民族伟大复兴和中国梦。因此教育改革需要深化,教育质量需要提高,教育现代化需要推进,人才强国需要建设。为此,国家教育部在2014年3月颁布的《关于全面深化课程改革落实
随着改革开放的不断深化,信息时代的快速发展,多元文化的交流碰撞越显频繁,提升人民对中国优秀文化的认同就显得极为重要。初中生作为我国文化传承和弘扬的主体,其对不同文化的态度关系到国家的强盛、民族的复兴,培养初中学生对本民族文化的认同是建设社会主义文化强国的要求,同时也是促进初中生全面发展的需要。初中道德与法治课作为初中生思想启蒙、观念建立的重要引导课程,承担着学生文化素养提高,文化认同培育,文化自信
历史的车轮永不停歇,我们推开了新时代这扇大门。2019年11月,国家印发了《新时代爱国主义教育实施纲要》(以下简称“纲要”),将对青年学生的爱国主义教育再次提上日程。高中思政课作为高考科目,坚守立德树人,关注核心素养,全面强化爱国教育,是培养高中生爱国情感的主要场所。结合新时代背景,优化高中思政课教学中的爱国主义教育具有现实价值且意义深远。本文主要从以下三个部分展开详细论述:第一部分,新时代高中思