论文部分内容阅读
如今,半导体工艺已经进入7nm时代,半导体工艺的继续提升正变得举步维艰,体系结构的发展也同样面临很多困难。为了突破传统微处理器体系结构对性能提升的限制,一些面向特殊应用场景的非冯诺依曼计算结构被提出。CMOS型伊辛芯片就是其中之一,用于高效求解组合优化问题。伊辛芯片的自旋个数决定能够支持的应用规模。为了支持大规模的现实应用求解,现阶段的研究聚焦于进一步降低伊辛芯片硬件开销,以集成更多的自旋个数。但是,目前在以较低的电路开销实现高精度的伊辛芯片局部搜索、概率翻转、自旋间互连结构,以及推广现实应用方面均面临诸多挑战。本文针对上述挑战,提出了相应的优化技术。首先,为了降低局部搜索电路的硬件开销,本文通过在问题映射阶段预先求和模型系数,减小局部搜索电路的硬件开销,并通过为多个自旋提供共享的局部搜索电路,减少所需的局部搜索电路个数。其次,本文将伊辛芯片的存储单元设计为可复用结构,能够同时支持伊辛计算和传统随机存储访问,以充分利用存储资源。再次,本文通过线性近似方法,在保证符合概率翻转理论特征的前提下,避免概率翻转所需的超越函数求解器,以降低概率翻转开销。然后,本文基于片上网络实现全连接结构的伊辛芯片,避免过长的自旋互连线对于芯片频率的限制。与片上网络结构相对应,本文将自旋的传播和更新设计为流水结构,进一步降低了全连接结构伊辛芯片的自旋更新电路开销。应用上述技术,本文基于28nm CMOS工艺设计并实现了两款伊辛芯片,并展示了他们在组合优化问题求解中的应用。特别的,本文首次将伊辛芯片的应用扩展到图像分割领域。本文的主要创新成果包括:(1)提出了预先计算技术、逻辑共享技术和存储复用技术。预先计算技术能够降低伊辛芯片20%的总硬件开销,或是以增加存储开销为代价降低40%的自旋更新器的硬件开销。后者更适合在存储资源可复用的伊辛芯片中使用。自旋更新共享技术以增加基态搜索时间为代价减少自旋更新器的个数。在设计中,一般选择2-节点或4-节点共享方案,对基态搜索时间的影响较小。存储单元复用技术使伊辛芯片的存储资源得以充分利用。(2)提出了线性近似概率计算模型及其电路实现方法。线性近似概率计算能够很好的符合自旋状态翻转概率与基态搜索中的势垒ΔE和温度T的理论模型关系,同时,又能有效避免使用超越函数求解器,降低实现概率翻转的电路难度。与当前概率翻转简化方法相比,线性近似概率计算方法能够提高7.6%的基态搜索精度,使其与运行在CPU上的“模拟退火算法-精度优先”方法的精度相差在1%以内。(3)提出了基于片上网络的全局连接结构,以及流水化的自旋传播和更新技术。该方法避免了直连线式的全局连接结构中较长的互连线,将互连线延时降低为直连线式的10%,使得设计更高频率的全局连接伊辛芯片成为可能。并且,该方法能够有效减小全局连接伊辛芯片的自旋更新硬件开销,将自旋更新器硬件开销降低为直连线式的9%。(4)基于28nm CMOS工艺设计并实现了两款ASIC型伊辛芯片。其中一款是局部互连芯片,主要面向图像处理领域;另一款是全局连接结构,可以支持更多类型的组合优化问题。相比于现有的ASIC型伊辛芯片,本文定制的伊辛芯片实现了更宽的模型系数位宽以支持准确的问题映射,并且实现了更高的运行频率和更精确的基态搜索。(5)本文首次将伊辛芯片的应用扩展到图像分割领域。本文提出了将图像分割映射到伊辛模型的方法,并基于本文定制的局部互连伊辛芯片,展示了使用伊辛芯片求解图像分割问题的效果。此外,基于本文定制的全局连接伊辛芯片,展示了使用伊辛芯片求解数的分类问题的效果。与传统计算机相比,本文定制的伊辛芯片能够显著提升上述组合优化问题求解的能效比。CMOS型伊辛芯片是面向组合优化问题的非冯诺依曼体系结构加速器,具有很好的研究和应用前景。该领域仍需更加系统的硬件优化研究以及面向现实应用的研究。本文提出了预先计算技术、逻辑共享技术、存储复用技术、线性近似概率翻转技术、基于片上网络的自旋间互连技术以及流水化的自旋传播和更新技术。这些技术在保证求解精度的前提下,帮助降低CMOS型伊辛芯片的硬件开销,提高其自旋个数。本文还提出了将伊辛芯片应用到图像分割领域的方法,成功的将伊辛芯片扩展到一种实际应用中。验证和评估结果表明,本文所提的解决方法是有效的,能够应用于CMOS型伊辛芯片的设计和实现,以及使其更好的求解现实应用。