半监督生成式对抗网络的算法—硬件协同设计

来源 :东南大学 | 被引量 : 0次 | 上传用户:misariza
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,深度学习算法取得了重大进展,目前已经是人工智能应用中最为广泛的算法,但是深度学习模型的训练需要海量的人工标注数据,生成式对抗网络(GAN)很适合用在标签数据少,无标签数据又比较多的场景。然而GAN的网络结构较复杂,庞大的计算量和参数量限制其部署在计算资源和存储资源受限的便携式设备上,资源受限这些问题仅仅针对算法优化或硬件加速设计是难以解决的。本文采用算法-硬件协同设计的方法,从适配硬件的算法优化与以算法的高效映射为导向的硬件设计两方面进行协同设计。在适配硬件的算法优化方面,通过探究经典的半监督生成式对抗网络模型的优缺点,改进半监督生成式对抗网络架构,分成两个阶段训练逐步提高网络模型的识别准确率;采用训练模型重构方案,在模型推测时将复杂的多分支训练结构转换为单分支结构,并定点化网络模型。充分考虑硬件实现时模型推测速度、灵活性以及内存消耗,在算法层面上设计出最优且适合硬件实现的半监督GAN网络结构。以算法的高效映射为导向的硬件设计方面,本文使用以输入特征点为导向的硬件加速策略来实现生成式对抗网络中的卷积转置与卷积层,并且探究卷积与转置卷积运算的四个循环的展开、分块方案,设计一种常规卷积与转置卷积通用的硬件加速器;并且搭建一个完整的半监督生成式对抗网络So C数字加速系统,在FPGA开发板上验证加速系统的计算性能、能耗比以及算法推测精度的差异。本文使用Ultra96-V2 FPGA开发板来验证半监督生成式对抗网络硬件加速系统,在片上存储容量、可用存储带宽和计算资源的限制下,加速器的峰值计算性能达到了115.2GOPS,性能功耗比达到了25.1 GOPS/W,相比于目前其他先进设计方案,计算性能与能效比均有了显著提高。
其他文献
学位
学位
目前,随着互联网技术和智能移动设备的快速发展以及低功耗蓝牙的出现,基于蓝牙的室内定位技术受到越来越多学术界以及相关行业的关注。蓝牙位置指纹室内定位方法虽然在近几年不断改进而日趋完善,但仍存在着一些问题需要解决:实际环境下,接收信号强度指示(Received Signal Strength Indication,RSSI)并不完全服从正态分布,使用常规滤波方法得到的RSSI指纹质量较低;加权K邻近法
汞是一种在常温下以液态形式存在的重金属元素,具有较强的挥发性、生物累积性、迁移性和毒性。化石燃料燃烧、金属冶炼、水泥生产等人类活动是汞污染的主要来源。中国长期以来是一个燃煤大国,2015年汞排放量达469 t,其中因燃煤导致的汞排放占40%。目前燃煤电厂已采用污染物控制装置协同脱汞,但燃煤副产物如脱硫石膏、吸附剂、飞灰中汞仍然具有二次释放的可能性,需引起重视。目前固体废物中汞的稳定化技术有土壤洗涤
学位
随着电网能源转型的不断深入,现代电力系统正在逐步向源荷互动、大规模新能源消纳、特高压交直流互联等方向发展。一方面,新能源的大规模并网使电力平衡呈现出明显的空间、时间不均衡,调峰调频压力突出,现有的发电跟踪负荷的模式已无法适应电网的发展;另一方面,负荷侧设备更加多元化,分布式发电、分布式储能、电动汽车等资源的大量应用使得负荷端的灵活可控性增强,为电网提供了丰富的可调资源。大规模可调的负荷侧资源如何参
在全球能源危机的背景下,人们提高了对风能、太阳能等可再生能源的开发力度。并网逆变器因为控制性能良好且运行模式灵活多变,常被用于电网与可再生能源之间功率转换的接口。然而随着新能源在电网中渗透率的逐渐增加,电网表现出弱电网特性。电网阻抗的大范围变化可能引起系统的稳定性问题,此外,电网背景谐波也会影响并网电流的波形质量。本文分别针对与电网直接耦合的逆变器和通过变压器并网的逆变器,提出改进前馈控制策略,提
关系抽取是信息抽取技术中的一项重要任务,也是知识图谱构建过程中的重要环节,其目的是从非结构化的文本中抽取出结构化的三元组知识。这一技术有着极大的商业价值和落地需求,然而现有的关系抽取系统在落地实现的过程中,普遍面临着两大问题的挑战——冷启动数据需求问题和运行中增量数据处理问题。近年来,越来越多的研究者开始关注这些问题,少样本关系抽取技术在应对冷启动数据需求问题上取得了一些不错的成果。但现有的少样本
学位
随着无线通信技术的迅猛发展,毫米波集成电路的应用越来越广泛,人们对无线通信产品的性能提出了越来越高的要求。射频功率放大器作为毫米波发射机的核心模块之一,引起了工业界和学术界的广泛关注。设计和研究基于低成本和高集成度的硅基工艺的射频功率放大器对于推动无线通信技术的发展具有重要的理论意义和现实意义。本论文以5G毫米波射频前端芯片项目为背景,基于65nm CMOS工艺开展24.2~29.5GHz硅基功率