基于可重构计算平台的k-means算法硬件实现

来源 :南京大学 | 被引量 : 0次 | 上传用户:charles8025
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
k-means是常用的聚类分析算法,在数据挖掘、图片分析、大气污染防治、用户模型分析等诸多领域有着广泛的应用。算法通过分析数据集合内各数据点间距离,将数据集分为若干子集,使得同一子集内数据点间距离小,不同子集的数据点间距离大。为提高算法运算速度,本文基于可重构计算架构对k-means算法的硬件实现进行研究,主要工作包含如下三个方面:1.本文基于可重构计算平台对k-means算法进行硬件设计,采用各子模块共享的存储和运算资源,通过状态机完成不同子模块下存储和运算通路的选通,从而实现资源的高效复用。2.本文采用k-means++聚类中心初始化算法,并完成了基于该初始化算法的硬件设计,从而提高算法聚类效果,并通过可重构的方式,减少初始化运算对资源的额外消耗。3.本文针对各子模块的存储控制逻辑,设计了不同的循环展开方案,减少循环间的流水空隙;针对各子模块的运算控制逻辑,分别设计了支持16/32路并行的计算单元,增加硬件实现的并行度,提高了运算速度。此外,本文还通过UVM和FPGA平台对硬件设计的结果进行验证分析,并对验证的覆盖率和设计的性能进行评估,该设计在FPGA实现下吞吐率约为27.17Gbps,在CMOS 14nm工艺下ASIC实现的吞吐率约为169.8Gbps,较现有工作平均周期数加速比最高可达8.37。
其他文献
现代汽车正朝着轻量化、高速、安全舒适、低成本与节能的方向发展。铝合金加工材料由于具有密度小、比强度高等一系列优良特性成为实现汽车轻量化的理想材料。铝合金薄壁压铸件因具有良好的轻量化效果和优异的力学性能,在汽车车身以及底盘类结构件上有广泛的应用前景。本文以AlSi10MnMg铝合金为材料通过压铸工艺制成的汽车后身承重梁作为研究对象,以金属固态相变理论为基础,利用差热分析、金相显微技术、扫描显微镜、X
智慧校园是指基于云计算、物联网、大数据、移动互联等技术而建立的校园信息化形态。在智慧校园中,基于位置的服务(Location Based Service,LBS)占据了比较重要的地位。LBS的基础是定位技术,在室外环境下,全球导航定位技术(Global Positioning System,GPS)可以满足人们的定位需求,室内环境中,GPS的定位精度急剧降低。而基于低功耗蓝牙的室内定位技术由于其价
随着高速列车“高速化”、“重载化”趋势的不断发展,对列车制动盘提出了更加苛刻的要求。由于高速列车制动盘结构复杂,芯部要求高强韧性而表面要求高耐磨和抗热疲劳性能。传统制造工艺加工周期长、成本高、加工难度大;近年来激光快速成形金属零件已经在航空等领域获得成功应用。金属零件的近净成形新型材料制造方法可以弥补传统高铁刹车盘制造工艺的不足。由于激光快速成形技术具有合金成分可调,易于制造复杂形状和难加工金属零
学位
学位
智能交通系统(ITS)是指将计算机视觉技术、图像处理技术和移动互联网等新一代信息技术应用于交通领域而形成的交通服务体系,并且受到了越来越多的瞩目。智能交通系统可以有效缓解交通拥堵,降低事故发生率,同时提高交通资源的利用率。车辆的检测与跟踪是智能交通领域重要的研究课题。通过对车辆的检测与跟踪,可以得到车辆的相关信息,这些信息既可以为后续对车辆进行辨识和动机判断提供样本,也可以作为向车辆驾驶者提供导航
基于嵌入式平台的复杂背景目标跟踪技术在智能视频监控设备、无人机导肮、无人驾驶、导弹制导等领域有重要作用。近年来,由于深度学习的发展,将卷积神经网络应用在跟踪问题上有准确率高、鲁棒性强的优点,但是基于卷积特征的跟踪算法计算复杂度高,又因为嵌入式平台面积和功耗的限制,导致实时难以达到要求。为了解决这个问题,论文旨在设计一种适用于嵌入式平台的应用场景,满足该场景功耗限制的卷积网络硬件部署方案,以Xili
学位
太阳翼(即太阳能帆板)是航天器在太空正常运行的能量来源,是航天器展开机构最重要的组成部分。随着航天器展开机构对阻尼力可控调节范围和控制响应时间需求的提升,现有的传统被动式阻尼器装置已经不能满足其需求。因此,研发一种具有更大阻尼调节范围和更好可控性的阻尼器是十分必要的。与传统被动式阻尼器相比,磁流变阻尼器由于其阻尼力矩的可控性及较高可控比等优势,可有效实现太阳翼在空间轨道上安全展开和平稳运行,在航天
本论文以Y/Eu二元系硝酸盐类稀土层状化合物(LRH)为研究对象,针对中性分子RE(hfa)3(H2O)3在LRH层间的插层柱撑、结构表征以及LRH纳米片的高效剥离、温感荧光特性和功能化应用进行了深入研究。通过对产物的XRD、FE-SEM、HR-TEM、STEM、SAED 和 PLE/PL 分析,结论如下:采用水热法将中性分子RE(hfa)3(H2O)3(RE=Y或Tb)成功插入到LRH层间,导致