【摘 要】
:
图形处理器(Graphics Processing Unit,GPU)具有极高的计算性能和相对廉价的成本,并且性价比以超过摩尔定律(Moore’s law)的速度发展。以Nvidia公司为代表的厂商推出了一系
论文部分内容阅读
图形处理器(Graphics Processing Unit,GPU)具有极高的计算性能和相对廉价的成本,并且性价比以超过摩尔定律(Moore’s law)的速度发展。以Nvidia公司为代表的厂商推出了一系列具有强大浮点计算能力和并行特性的GPU。GPU在通用计算领域图形处理器(GPGPU)领域取得了长足的发展,基于GPU平台的通用计算也正在成为一个计算领域的研究和应用热点。H.264/AVC是由ISO/IEC和ITU-T共同推出的新一代视频编码标准。然而,它采用可变分块大小运动估计/补偿,多种帧内预测模式等新的编码特征工具,计算复杂度高。X.264是完全符合H.264/AVC标准的开源编码器。与H.264/AVC校验模型相比,X.264已经进行了一些算法和程序结构优化。考虑到视频编码器的计算需求和GPU的通用计算能力,本文利用GPU的强大浮点计算能力和并行特性,研究基于GPU平台的X.264视频编码器的优化与实现。具体地,本文的主要工作和贡献如下:首先,详细分析了X.264视频编码器的结构,特别是其在函数层次、数据结构层次等方面的缺陷,并对其并行性和GPU平台移植进行了可行性分析。此外,利用Intel Vtune性能分析器,对X.264编码器的性能进行了实际的测试。通过统计分析,得到了X.264视频编码器的主要函数和各功能模块的耗时情况。这样,为选择X.264编码器中计算耗时且具有一定并行性的模块进行GPU并行优化奠定了良好的基础。其次,在分析X.264运动估计算法的基础上,对绝对差之和(SAD)的计算及其大小比较进行并行优化,并采用统一计算设备架构(Compute Unified Device Architecture,CUDA)编程在GPU平台上进行实现。H.264/AVC视频编码器的运动估计是按照块进行的,本身具有较高的并行性,适合于GPU实现。本文以全搜索为例,将最佳块匹配准则,即SAD的计算及其比较移入GPU完成,并且采用单指令、多线程(SIMT)实现,从而加速了运动估计过程。对于Foreman等典型的视频测试序列进行实验测试,实验结果表明,提出的全搜索运动估计GPU并行化方法能够提高运动估计效率约6-8倍。并且,视频的空间分辨率越高,搜索范围越大,GPU加速的效果越显著。与基于H.264/AVC校验模型的全搜索运动估计GPU相比,它的加速比相当,但运动估计模块的实际时间开销有所降低。
其他文献
在能源短缺的背景下,发光二极管(LED)由于低能量损耗、可靠性好、亮度高等优点将逐步取代传统光源而成为下一代理想光源,特别是它的响应时间极短,可用于高速通信。可见光通信
随着电网公司对供电可靠性和电网运行安全性要求的不断提高,故障快速定位技术以及故障风险评估技术是其中必不可少的环节。与主网相比,配电网存在供电半径长、自动化终端覆盖率低以及单相接地故障率高的问题,严重影响供电可靠性考核指标,制约了配电网安全经济运行水平。配电网故障定位问题的本质是在配电网发生故障后,快速识别故障类型以及快速定位故障点,并以便于运维人员快速抵达故障点排除故障,达到快速复电的目的。而故障
目的:观察“补肾活血”法治疗糖尿病肾病的临床疗效以及探究黄芪甲苷对1型糖尿病STZ小鼠肾脏保护的机制,为“补肾活血”法治疗糖尿病肾病(Diabetic Kidney Disease,DKD)提供临床依据,为中医药防治提供新的证据。方法:临床研究:将符合糖尿病肾病Ⅲ-Ⅴ期诊断标准患者随机分为观察组和对照组,各30例。观察组采用西医对症治疗+自拟“补肾活血方”;对照组采用西医对症治疗+院内制剂“滋肾降
纤维素是一种有机化合物,在自然界里分布广泛、含量丰富,但是由于其纤维素的结构复杂,因此很难被分解,目前应用的有化学法、物理法和微生物法,生物降解是其中较为可行的无污
在我国,桥梁上部结构的预制建造技术相对比较成熟,并且大量于桥梁建设中。全预制装配技术成为目前桥梁建设的热点,特别是对于高烈度区域,装配式桥梁结构的连接可靠性、耐久性和抗震安全性是制约其应用推广的关键问题。本文以北京至雄安高速中预制装配桥梁工程为背景,基于生态、绿色和环保的工程理念,为满足实际的工程需求,开展了预制装配式结构抗震连接技术研究,以推动高烈度区预制装配式桥梁技术的应用。京雄高速预制拼装桥
连杆胀断裂解加工由于加工工艺简单、装配质量高、加工速度快、成本低等优点,已经逐渐取代传统的平切加工方式,迅速占领连杆加工市场。胀断连杆加工的关键工序是裂解槽的加工,激光加工出的连杆裂解槽形貌优异,连杆裂解槽呈“V”形,有利于裂解胀断,胀断后的三维形貌装配质量高,且激光加工效率高、精度高、加工一致性好、无刀具磨损,使用激光加工连杆裂解槽已成为连杆裂解槽的主要加工方式。激光加工发动机连杆裂解槽装备是光
全氟辛酸(PFOA)广泛应用于工业和民用产品中,然而其对人和动物的肝脏、神经系统和免疫系统具有严重的毒性危害,是一类新兴难降解环境污染物。同时,PFOA全球分布十分广泛,对生态系统和人体健康威胁巨大,因此针对PFOA的高效处理技术开发具有紧迫需求。光催化技术能够在温和条件下实现对有机污染物的高效降解,然而其对PFOA的降解效率目前还比较低,并且当前研究主要集中于对PFOA的光催化氧化降解,对PFO
黑色素(Melanin)是吲哚类或者多酚类物质经酶促氧化在生物体内产生深色不规则高分子聚合体。天然黑色素主要从动植物中获取及一些微生物发酵产黑色素,其中真核模式菌株粗糙脉孢
沥青路面因具有平整度高、耐磨性好、噪音低、污染小、便于维修等诸多优点在我国的道路中被广泛应用。但沥青由于色泽黑,对太阳辐射吸收率高,夏季沥青路面吸收大量的热能从而
近年来,关于“分子电子器件”的研究,已成为当今化学学科与材料学领域里的研究热点。分子导线是分子电路中最基础的元件,起着传递信息和连线的作用,因此发展分子导线具有深远