论文部分内容阅读
人脸检测算法具有数据带宽要求高、中间数据存储空间需求量大、计算模式多样化的特点,可重构计算在能量效率和系统灵活性间能达到很好的平衡,是比较理想的实现方案。在人脸检测可重构实现时,存在积分图的数据访存延时过大、分类器的配置时间过长的问题,是计算性能提升的瓶颈。本文基于可重构处理系统REMUS-Ⅱ,重点开展了局部积分图数据重用、分类器配置信息管理策略的研究。 主要工作与创新点包括: 1.提出了一种基于积分图快速刷新与动态数据挑选的数据重用机制。首先,采用强分类器动态重构的计算方式,以子图像数据来源为选择依据动态配置可重构计算阵列实现相应的强分类器功能,并采用以检测子图像为单位的行/列快速刷新方法动态计算局部积分图,避免了传统静态级联结构中图像数据的不连续性,减少片内数据缓存容量需求;其次,基于非定制的计算阵列与存储结构,根据分类器类型动态解析数据挑选方式,生成数据访问模式的控制信息,实现连续规整数据访问。 2.提出了一种基于LRU_FRQ算法的配置信息加载策略。以分类器配置流分布不均性为依据对配置信息进行统计分级,在图像检测过程和分类器局部计算过程中分别采用固定优先级和基于最近访问频度动态分级的配置信息加载策略,并通过在配置信息加载策略中引入并设计合理的配置信息更新频度因子,使得使用频度较高的强分类器配置信息,提高了各级配置信息缓存的访问效率。 3.改进了一种以强分类器组为划分单位的配置信息并行生成策略。基于重构控制器中多个微控制单元间的多模式邮箱通信机制,在人脸检测配置信息生成过程中采用以强分类器组为划分单位,将4个重构任务打包为1个强分类器组,进行组内流水、组间并行的配置分组结构,有效隐藏了配置信息的生成时间。 基于本文的研究工作,在REMUS-Ⅱ上实现了面向人脸检测的可重构系统,系统仿真与芯片实测表明,本文所研究的可重构数据通路与配置通路结构及相应的优化方案,可以有效地提高面向人脸检测算法可重构系统的数据存取和重构性能(系统重构性能平均提高了2.03倍,数据存取性能平均提高了3.1倍)。与主流的FPGA方案比,基于REMUS-Ⅱ的人脸检测系统能量效率提高约5倍。