基于区块链的隐私深度学习

来源 :浙江大学 | 被引量 : 0次 | 上传用户:pengpengice
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在单机数据上训练的深度学习机制,受限于数据量和算力容易出现过拟合以及较低的可用性等问题。为了解决这个问题,采用中心化的训练架构,聚合多个参与方的数据来训练一个全局模型是普遍采用的模式。或者采用分布式的训练模式,基于中心化服务器聚合各个参与方的模型梯度更新,但这两种中心化的架构始终存在单点故障的可能。此外,当前深度学习系统对于数据隐私和模型隐私的关注不够,限制了深度学习在诸如医疗、金融等敏感数据上的应用能力。同时,在多方参与的系统中,缺乏对参与方贡献的价值评定和奖励,因而会存在不公平性的问题。另外深度学习模型还依赖大量可用的标记数据集,实际应用中缺乏有效的数据集协作标注机制。本文围绕着隐私和去中心化协作,结合区块链智能合约,去中心化数字身份以及隐私保护技术共同实现新的深度学习训练与服务部署系统和数据存储与标注系统,并对两个系统中的经济行为进行抽象,通过智能合约完成激励,用于促进系统参与各方的高效、公平协作。
  首先,设计并实现了基于差分隐私、安全多方计算与联邦学习等方法的隐私保护深度学习系统,能够保护系统各参与方的数据隐私和模型隐私。在提供隐私保护的系统中,模型持有方、数据持有方、算力提供方以及数据存储方等可以更紧密协作,促进深度学习模型在需要考虑数据敏感性和模型敏感性的场景中的有效利用。
  其次,实现了一个去中心化的数据存储平台,并基于去中心化数字身份,将数据的所有权完全交于用户个人控制。同时,在此存储平台上,用户可以自由分享自己的私有数据到共享平台,用于深度学习系统其他参与方获取数据。另外考虑到深度学习模型大多依赖于有监督学习,在系统机制中鼓励用户参与此存储平台中的数据集标记,作为深度学习系统的辅助。
  最后,基于区块链平台构建了多种智能合约,用于对深度学习系统和数据存储平台中经济行为的激励。如用户分享数据到公共平台,参与数据集标注,以及在深度学习系统中向模型所有者提供数据的使用权等行为,通过部署的智能合约可以自动完成行为奖励。同时,为了系统的健壮性,降低恶意行为发生的可能性,构建了用户行为建模体系,基于公开可查且不可篡改的智能合约设计了用户声誉合约模块。
其他文献
三疣梭子蟹(Portunus trituberculatus)是一种重要的大型海洋经济甲壳动物,养殖面积广,是我国三大主要养殖蟹类之一。三疣梭子蟹性腺发育是繁育的基础,卵巢是卵子产生的器官,卵巢发育的质量直接关系到产卵量、受精率、受精卵的孵化率、后代成活率及质量等指标。Wnt信号通路是一个复杂的负向调节信号通路,参与多种生命活动,并且在哺乳动物中已经证实其在卵巢发育过程中有重要作用。目前为止,尚未
[db:内容简介]
The recently proposed coprime array, as an example of a sparse array of antennas, could produce more effective virtual sensors (degrees of freedom (DOFs)) than the number of actual sensors being used.
学位
Underwater Acoustic(UWA)Communication uses acoustic waves to transmit and receive data under the water.Underwater radio waves suffer from high attenuation.Optical waves suffer from heavy scattering.Ac
学位
Detection, identification and intelligence are the blistering topics and requirements nowadays in modern era. As artificial intelligence is going to seizure the whole world soon, most of the explorati
学位
汉字是世界上使用最多的文字,汉字识别在残疾人无障碍阅读、文献自动录入、邮件分拣、银行票据处理、证件识别等领域有着重要的应用价值。汉字数量巨大,手写风格各异,并且汉字中存在大量的形近字,导致脱机手写汉字识别一直存在准确率偏低的问题。近年来,深度学习发展迅速,在模式识别、自然语言处理、语音识别等领域都取得了不错的成绩。因此,本文采用深度学习的方法对脱机手写汉字识别进行研究。针对汉字识别大分类问题,采用
图像超分辨率技术是近年来计算机视觉领域的研究热点之一,其可以有效地弥补硬件成像设备精度的不足,以较高的还原度呈现出真实场景。图像超分辨率技术在安防、遥感、医学和高清显示等领域有着广泛的应用场景和需求。本文围绕提高图像超分辨率性能展开研究,并在基于学习的超分辨率方法上从提升学习字典训练效率和提高图像重建质量两个方面进行改进。本文首先针对传统字典训练效率低的问题,提出一种新的图像块相似性判断方法及结构
学位
随着我国新消费时代的到来,消费模式开启了新格局,品质消费备受追捧。受到新消费热潮的影响,生鲜企业也在不断转型升级,生鲜超市等新兴生鲜消费渠道逐渐增长。由于生鲜供应链具有配送成本高、仓储难度大、产品损耗率高等特点,大部分涉足生鲜的企业都处于亏损状态。如何控制供应链成本,对生鲜供应链的选址、库存和路径进行集成优化是尤为重要的。本文正是基于此背景,在研究以超市为代表的现代生鲜供应链体系基础上,综合直送模
学位
聚合博弈是成本仅依赖于其自身策略和关于所有个体的聚合策略的一类重要博弈.其在自然科学、经济学和工程科学等领域中广泛应用.特别的,在工程科学中,无线通信、交通系统、智能电网等方向的聚合博弈问题得到了越来越多富有成效的研究.博弈理论的关键是纳什均衡问题的研究.因此,求解纳什均衡的算法受到了广泛关注.近年来,随着大规模通信网络和分布式技术的发展,很多研究学者致力于分布式纳什均衡算法的研究.相比于传统的集
学位
观察数据中发现变量之间的因果关系,解释事件是如何发生以及预测其未来发展趋势,几乎在所有学科中都有研究和应用。例如医学、生物学、经济学、物理学、社会科学等领域均把因果关系作为解释、预测和决策的基础。信息科学领域,可以使用贝叶斯网络中的马尔科夫毯(边)来表示真实世界中的因果关系。近年来,有学者采用基于回归正则化模型马尔科夫边的发现方法从观测数据中研究事件之间的因果相关性,并从理论上揭示了基于回归正则化