【摘 要】
:
深度卷积神经网络(Deep Convolutional Neural Networks,DCNN)已成为深度学习中用于数字图像内容分类的关键算法之一,这是因为DCNN可以从足够多的训练数据中学习到具有高度代表性的分层图像特征。但是,DCNN的计算复杂度要比经典算法的计算复杂度大很多,这造成了基于中央处理器(Central Processing Unit,CPU)或图形处理器(Graphics Pr
论文部分内容阅读
深度卷积神经网络(Deep Convolutional Neural Networks,DCNN)已成为深度学习中用于数字图像内容分类的关键算法之一,这是因为DCNN可以从足够多的训练数据中学习到具有高度代表性的分层图像特征。但是,DCNN的计算复杂度要比经典算法的计算复杂度大很多,这造成了基于中央处理器(Central Processing Unit,CPU)或图形处理器(Graphics Processing Unit,GPU)平台的许多DCNN应用在资源、能效和实时性等方面有诸多限制,使它们很难应用于实时性要求高的场景。因此,人们越来越关注在嵌入式系统上实现DCNN的方案,这样可以提高DCNN的计算速度和实时性。现场可编程门阵列(Field Programmable Gate Array,FPGA)有着强大的性能和可编程性,为了减小DCNN的计算时延和能耗,很多人选择用FPGA对DCNN进行加速。FPGA上DCNN的运行耗时主要受卷积层、全连接层和内存交互三个方面的影响,但前人大多只对其中一个方面进行加速,很少有硬件加速器能加速这三个方面。本文设计了一个高性能的DCNN硬件加速器,能够对DCNN中卷积层、全连接层和内存交互进行加速与优化,使整个网络性能得到显著提升。具体来说,本文选择一种轻量的快速乘法来改进Winograd卷积加速算法,同时快速乘法还被用来加速全连接层的矩阵乘法计算,这样卷积层和全连接层的计算速度就有了提高。对于减小片外和片内之间的内存交互量,本文提出一种梯形复用的内存交互优化策略,它使用梯形数据块传输数据来提高数据的复用率,所以该策略能减少卷积层的内存交互。最后,本文在Zynq XC7Z100开发板上搭建了DCNN硬件加速器,并用Alex Net、VGG-16和Res Net-50这三种DCNN进行了验证,吞吐量分别达到了65.3GFLOP/S、505.3GFLOP/S和560.2GFLOP/S。
其他文献
在这个互联网来临的新时代,新媒体行业有着肉眼可见的飞速发展,新媒体技术也不断发展,党和政府为了更好地传递消息并和受众进行良性互动,诸多主体尝试向新媒体领域涉足。回看2009年的下半年,隶属于湖南省桃源县的官方政务微博"桃源网",它的出现标志着政务类微博自此走向繁荣发展的道路。本文选取“中国消防”官方微博为代表来进行消防类政务微博的研究,以话语建构方式为基础,通过个案分析法和内容分析法,从内容分析下
在互联网时代时政类新闻的受众逐渐被新媒体分解、引流,传播率大大降低。为了改变这一现状,传统主流媒体积极创新新闻生产和传播方式,发展融合新闻产品。在众多融合新闻产品中,短视频成为移动传播的重要形态。各大主流电视媒体纷纷推出系列短视频节目,并且将时政新闻报道剪辑成短视频投放在大量新媒体平台上,时政新闻短视频成为主流媒体争夺话语权、引导舆论的积极探索。本文以短视频类融媒产品为例,运用内容分析法和问卷调查
共情传播研究着眼于探究信息传播过程中共情的产生过程和传播特性,以及共情传播的影响和作用。本文通过深入辨析共情这一心理学范畴概念的内涵,结合传播学理论基础和学者们对共情传播的概念界定,将共情传播解释为传播者在传播过程中采用一些策略或方式使传播对象产生与传播内容共情的效果。在疫情这一突发重大公共卫生事件的背景下,共情传播在新闻报道中的运用和影响更为显现。本文以央视《新闻联播》疫情报道为例,探究其共情传
伴随着移动互联网的高速发展,新闻资讯行业全方位升级重塑,新闻资讯平台成为进入移动互联网的重要入口。四大门户网站纷纷上线移动新闻客户端,抢占移动终端市场,聚合类资讯APP作为移动新闻客户端的一种,以市场细分、智能分发的特点在市场站稳脚跟。今日头条作为聚合类资讯APP的典型代表,在市场起步阶段,把握市场空缺、抓住社会化阅读的契机,依靠算法技术进行内容分发。以其个性化的推荐方式、多元化的传播媒介实现智能
读图时代的到来,让我们在网络社交中形成了独特的交流风格。当下的网络社交活动离不开表情包的参与,它承担的不仅是简单的表情符号意义,还是网络世界中一种新的符号表意方式。“萌文化”的出现,让热衷于互联网的青年群体受到这些文化所携带的情感和视觉的冲击,也推动了“萌系”表情包在微信平台上的传播。在年轻人的语言中,“萌”被赋予了以“可爱”为中心的丰富意义,他们在进行网络人际传播时,将“萌系”表情包运用其中,以
近年来,深度学习由于其出色的表现在计算机视觉,语音识别,情感分析等研究领域都取得了十分优异的成绩,大量的关于深度学习的应用出现在我们的日常生活中,为丰富我们的生活提供了许多的便利。但是最新的一些研究工作证实,在各个领域表现出色的深度学习模型非常容易受到攻击者的影响,当攻击者在输入样本中增加一个十分微小的扰动就可以导致深度学习模型给出错误的分类结果。但到目前为止,在对抗环境下对深度学习脆弱性的研究主
聚类是机器学习领域处理数据的重要方法,在众多学术领域中被广泛地应用。例如,目标用户的群体划分、不同产品的价值组合、探测发现异常值等。在这些场景下的数据的密度通常都是不均匀的,因此在这样的数据集上进行的聚类,要求聚类算法适合非均匀密度数据集。但传统的聚类算法在非均匀密度数据集上的聚类效果并不理想,并且传统聚类算法对参数依赖严重。针对上述问题,论文提出了一种基于图像分割模型的密度聚类算法DCABISM
目前传统的视频分类方法是基于人工提取的特征,这种方法在早期任务中取得了较为优秀的性能,但传统方式非常依赖特征提取算法以及特定任务的知识,因此,目前已过渡到基于深度学习的方式。解决该问题的传统深度学习算法是基于双流卷积神经网络结构,将网络分为空间流与时序流,分别使用视频帧和密集光流输入网络,获得最终分类标签。但传统方式存在一定弊端,即以密集光流作为特征,该特征目前的提取算法计算量庞大,且极其耗时,无
在农业领域,随着信息科技的高速发展,传统的手工劳作方式逐渐被智能化作业所代替。农业机器人的引入既提高了劳动效率和作物产量,又带动了农业经济的发展。众所周知,导航系统是农业机器人进行田间劳作的关键,这对于精准化作业来说至关重要。因此,针对农业机器人的导航系统研究已经受到越来越多学者的重视。本文针对农业机器人采集的田间作物的视频数据,基于深度语义分割模型实现农业机器人的自主实时导航。首先,为了改善低分
毫米波大规模MIMO是未来移动通信最具潜力的研究方向之一。然而,由于大规模MIMO系统中配备多个昂贵的射频链路使得硬件的成本和复杂度大幅增加。天线选择技术通过优化策略选择部分高性能天线通信可以在保证系统性能的前提下简化硬件结构;同时混合波束成形技术利用低维数字波束成形与高维模拟波束成形,大大降低了射频链路数目的需求,与天线选择技术相结合可以进一步降低系统复杂度,提升信号传输质量。但是目前传统的面向