支持多密钥的联邦学习算法研究与实现

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:crazy5555
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据技术的不断发展,由此带来的“数据安全隐私”以及“数据孤岛”这两大问题成为制约人工智能继续发展的主要瓶颈。联邦学习技术保证了数据不从本地暴露,而后可以通过联邦安全多方计算下的模型聚合方法共建模型,从而解决这两大难题。然而目前联邦学习框架中在安全性上还存在以下问题:1.直接对模型聚合的方法,中心节点可以直接看到模型参数,从而逆向推导出参与方的数据,进而泄漏了隐私;2.基于单密钥同态加密的聚合方法中,每个参与方持有的密钥相同,单个用户密钥的泄漏意味着整个系统密钥的泄漏。由此随着参与方的增加,整个联邦学习系统中密钥泄漏的概率也在增加,另外若参与方中存在恶意节点,则可利用其持有的密钥窃取其他参与方的模型参数。本文首先针对传统机器学习流程中的数据生命周期进行阐述,并且详细分析了数据流动各个阶段中的隐私需求以及联邦学习在其中发挥的隐私保护的作用,同时针对现有联邦学习框架中的模型聚合方法以及隐私保护手段所存在的安全性问题提出了一种攻击方法。该攻击方法在限定其能力以及所具有知识的情况下,可以定向更改聚合后的模型,将聚合模型更改为恶意模型。为了避免上述攻击,同时为了解决现有联邦学习框架在安全性上存在的问题,本文提出了一种支持多密钥下模型聚合的联邦学习方案。多密钥即各个参与方持有的密钥不同,即使单个参与方的密钥泄漏,也不会影响到整个系统的安全性。此外即使参与方中存在恶意节点,也无法利用其持有的密钥解密得到其他参与方的模型参数。该方案依托现有的客户端-服务器的联邦学习框架以及双陷门同态加密算法,每个参与方对本地数据求解机器学习模型,之后采用双陷门同态加密算法,对本地模型用其对应的公钥进行加密并上传至云端。在双云辅助下,对不同公钥加密的模型密文进行聚合,保证云端无法得到明文下的聚合结果,并将密文下的聚合结果返回给参与方解密。本方法相比现有的联邦学习方案,能够有效防止某一参与方因密钥泄漏或参与方中存在恶意节点所导致的数据隐私泄露问题,该方法既保证了参与方的数据和模型的隐私,也因为最终模型集成了多个参与方的数据而具有更强的泛化能力。
其他文献
二十世纪八十年代之前,多数集成电路企业采用IDM(integrated design and manufacture)商业模式。这种模式下,IDM厂商负责集成电路(IC)设计、制造、封装测试等各个环节,甚至也会延伸到下游电子终端。然而随着芯片微缩以及加工技术和设备成本的飞涨,开发先进制程技术的成本也越来越高,许多IDM厂商无法通过投资生产线实现收益。随着产业分工的进一步细化,无晶圆厂和无生产线设计
面对云计算等互联网应用驱动之下的互联网流量持续增长,相干光通信系统使用超高波特率、高阶调制格式信号,有效提升频谱效率,进而支撑海量信息传送需求。与此同时,现有系统下光信号对发射机硬件损伤更加敏感,迫切需要开展硬件损伤监测与分析技术的研究。本论文围绕光通信系统中的信号同相/正交(In phase/quadrature,IQ)分量不平衡和时钟偏移等主要硬件损伤,重点分析研究可适用多损伤共存下的宽范围联
随着科技的进步和经济的飞速发展,研制开发新型实用高性能的传感器,在各行各业都具有重要价值。在各种光学传感器中,基于模间干涉的锥形传感器成为研究中一大热门方向。锥形光纤将传感器的结构尺寸缩减到毫米乃至微米量级,具备成熟的理论基础和制备技术,并且具有高灵敏,高可靠性等优点。本文以此为出发点,从理论设计和实验制备以及性能检测等三方面出发,基于模间干涉原理,提出了基于锥形光纤的两种传感器结构,分别为芯径较
近年来,2μm波段光纤通信越来越受到关注。在该波段,掺铥光纤放大器具有更宽的增益谱,光子带隙光纤(Photonic Bandgap Fibers,PBF)具有更低的理论衰减值(0.1 d B/km),这些优势有助于解决目前光纤通信面临的数据流量大,而光谱资源有限的问题。密集波分复用(Dense Wavelength Division Multiplexing,DWDM)技术在光纤通信中是解决大容量
随着5G、大数据、物联网以及虚拟现实等新型技术和应用发展,光通信系统容量和动态业务带宽有了更高的要求。上世纪香农提出连续的高斯分布信源可以实现加性高斯白噪声信道的最大通信容量,概率整形技术由此孕育而生。尽管目前概率整形编码方案已经日渐成熟,但是围绕概率整形光系统的信号处理研究依然处于起步阶段,现有围绕标准正交幅度调制的信号处理方案,在概率整形系统下存在性能恶化与失效问题。为此,本论文围绕概率整形光
当今社会,随着第二语言学习特别是英语学习越来越收到广泛关注,人们对计算机辅助语言学习系统的要求越来越高。错误读音检测与诊断是语言学习的重要组成部分,也是计算机辅助语言学习系统的关键技术。相比传统的老师纠错,计算机辅助的错误读音检测与诊断具有成本低和灵活性高等特点,受到越来越多人的青睐。计算机辅助的错误读音检测与诊断任务可以看作一项特殊的音素序列标注任务,即当识别的音素和标准音素(从呈现给用户的文本
近年来,随着计算机硬件设备的更新换代和深度学习技术的不断发展,图像和视频的篡改变得越来越容易,尤其是人脸这种具有身份标志性的特征,如果被篡改,会带来严重的社会问题。因此,有效的人脸篡改检测算法尤为重要。近几年也有不少研究人员对人脸篡改领域做了相关的研究,但是由于目前的人脸篡改方法越来越多,而且篡改产生的人脸越来越逼真,导致以前的方法基本失效。针对以上问题,本文以神经网络为基础,从图像增广和噪声滤波
计算机技术的发展加快了信息的传播速度,也降低了数据挖掘的成本。将计算机技术与生物知识相结合,并使用计算方法去挖掘潜在的生物知识已经成为未来的研究趋势。近年来,随着疾病和基因相关数据的积累,人们逐渐发现通过已有的疾病基因关联关系来预测致病基因通常能够取得很好的效果。传统方法基于疾病基因的模块性假说,即相似或相同疾病的致病基因在蛋白质相互作用网络上也相互靠近。当前,致病基因的预测主要采用的是基于异构网
骨是人体最大的器官之一,具有支撑和承受力的作用。在我国中老年群体中,骨质疏松和骨关节炎在老年人群体中有着较高的发病率,严重影响着患者的生活质量和生命安全。随着我国人口老龄化加重,骨质疏松及骨关节炎患者的数量在不断增加,但是针对该疾病的治疗手段有限,因此,急需寻找新的疾病检测手段及预防和治疗方法。本文以间充质干细胞敲除PIP5K1c的小鼠模型作为研究对象,探究PIP5K1c对于骨稳态的调控。在对小鼠