SIMD相关论文
随着计算机相关产业的飞速发展,特别是移动互联网的出现,计算机所要处理的数据不仅在规模上越来庞大,在结构上也越来越复杂。大数......
随着大数据和云计算应用的普及,对于海量数据处理能力的需求越来越高。用于大规模数据处理的数据密集型算法是以I/O访存和数据处理......
H.264/AVC是由ITU-T和MPEG共同制定的最新的视频编码标准.与现有标准相比,H.264获得了更高的压缩性能,同时具有更好的网络适应性.......
随着通信技术快速发展,对多媒体信息的需求越来越多,为了适应多媒体通信、消费类电子产品等对视频应用的更高要求,ITU-T和ISO/IEC合作......
多媒体应用是近年来计算机领域的研究热点。多媒体应用的代码往往具有较高的并行度。为了获得更高的性能,几乎所有的处理器厂商都......
随着视频压缩编码技术和网络技术的不断发展,基于网络传输的视频得到了广泛的应用。长期以来,我国在数字音视频产业发展方面一直受......
该论文对虚拟内窥镜中的关键技术做了比较深入细致的研究,主要包括成像算法的加速和系统导航功能.成像速度是影响虚拟内窥镜技术推......
智能交通系统(ITS)是新一代的交通管理系统,它包括交通流量检测、车辆识别、交通异常事件检测等方面,车辆的实时检测算法是基于视......
该文提出了两种SIMD自动优化方法,基于向量化的方法和基于模式匹配的方法.这两种方法都可以自动生成SIMD指令,对某些多媒体程序取......
医学图像三维可视化技术是当前可视化研究的重点,也是实践中最常遇到的。直接体绘制技术是可视化中一类重要的技术。与从数据场中抽......
随着计算机技术和互联网技术的发展,信息检索已经成为一项重要的技术,在各个领域都有着广泛的应用。因此,对信息检索进行硬件加速以提......
数字信号处理器是面向数字信号处理的专用处理器,其结构与面向的应用特点息息相关。运用VLIW超长指令字的处理器体系结构,能够使得......
视频是重要的数字信息载体,视频传输已经渗透到我们生活的方方面面。随着视频内容增长和视频产业的迅速发展,4K视频和3D视频逐渐走......
近年来,数据挖掘已发展为学术界和业界研究的关键领域,以社交网络和文献引用等关系为代表的稀疏图结构数据挖掘是重要分支。随着大......
随着数字信号处理器(DSP)应用的不断扩展,如何提高DSP的运算性能面临着新的挑战。SIMD架构能充分发掘应用的数据级并行,以较低的硬......
随着CFD应用的推广,以DG为代表的高阶数值方法得到广泛应用,对欧拉方程的RKDG显式求解是其中一个重要的应用分支。HopeFOAM是一个......
随着互联网视频业务的快速发展,网络传输带宽面临越来越大的压力,市场对于压缩效率更高的视频编码标准的需求也愈发迫切。HEVC和AV......
基于ARM高性能处理器的SoCs是移动计算的主要平台,也是下一代高性能计算系统(HPC)的候选平台。ARM架构为满足新的需求而不断更新,......
随着第五代移动通信(5G,5th Generation Mobile Communication)标准的制定,移动通信逐渐迈入5G时代。5G引入了较多的新技术,包括低......
海洋数值模式是精准海洋环境预报的核心手段.随着计算分辨率的不断提高,海洋数值模式对计算性能的要求也越来越高.为了提高模式计......
本文首先介绍视频信息在压缩过程中去除空间冗余、时间冗余和统计冗余的原理。在AVS-M视频编码标准中利用整型余弦变换和多方向......
基于SIMD技术的媒体处理器在多媒体处理领域凭借着其良好的可编程性和高性能而备受关注。但是其性能的进一步提高却受制于一些非运......
该文的课题是根据超低码率应用的特点和要求,研究在MMX/SEE的多媒体支持平台上如何实现高效的H.263实时视频压缩.该文的主要贡献有......
在高性能处理器中实现乘后加运算指令,将能减少运算的计算延时和算法的迭代次数,提高处理器的计算性能。设计了一种6级全流水SIMD浮......
该文提出了一种新的高速三维实时图象系统的设计方法 ,在对图象存储算法分析的基础上 ,根据算法内在的并发性 ,提出了一种流水式多......
SIMD利用FPGA芯片来实现ABC95阵列机中主要的芯片组 ,其中 16个PE处理器芯片是由FPGA芯片实现的。分析了存储器无冲突访问硬化的方......
在计算机图形学、积分计算和神经网络等应用场景中,平方根函数的高性能实现在构建处理器的基础软件生态中起到了十分重要的作用。......
ABC95 array computer is a multi-function networks computer based on FPGA technology, The multi-function network supports......
ABC95阵列机是采用FPGA设计的多功能互连结构的计算机 ,多功能互连网络是指支持处理器到存储器的矩阵无冲突访问模式和增强型的处......
根据龙芯3B处理器特有的SIMD运算部件和指令集,在GCC编译器中实现了SIMD访存和SIMD运算的自动向量化.针对SIMD访存,给出了现有的访......
离散余弦变换(DCT)是图像处理领域广泛使用的一种变换方法,其中,Feig的2D DCT算法被认为是需要加法和乘法操作次数最少的.为了加深......
Photon mapping is a global illumination algorithm which is composed of two steps: photon tracing and photon searching. D......
大整数运算广泛地应用于公钥加密算法、大规模科学计算中高精度浮点数运算类以及构建大特征值等领域,然而其大部分算法空间和时间......
为了获得尽可能高的并行计算单元的计算能力,对SIMD图像处理机的存储系统进行了深入研究.该存储系统根据图像处理应用的特点,使用......
提出通过利用SIMD技术强大的运算能力和并行能力,有效地提高DRC效率的方法.实验表明经过利用SIMD方法优化后的DRC算法的效率,是经......
VLIwDSP通过软件流水获得时间并行性,通过指令分簇获得空间并行性.指令的分簇本质上是资源分配问题.传统的指令分簇假设一条指令分到......
LSSIMD协处理器是用于底层图像理解的16位定点嵌入式阵列处理器,该处理器除SIMD固有的数据并行性外,还具有三级流水和三组指令并发......
提出了基于单指令多数据(single instruction multipledata,SIMD)指令集架构的4×4变换系数重用算法,用于简化H.264/AVC自适应块变......
比较了典型的MIMD和SIMD两种流处理器结构的优劣,给出了SIMD流处理器的一种实现方式,介绍了流处理器上的两级编程模式。研究表明,流处......
宏SIMD短向量管理部件是高性能通用微处理器和媒体处理器的重要部件.文章提出一种基于交叉开关的宏SIMD短向量管理部件设计,用于音......
不同于传统的标量数学计算,向量数学库提供的加速比高,能够充分利用飞腾M6678的并行计算能力。文章比较了现有的数学函数库,包括标......
本文首介绍了一种基于H.264嵌入式视频监控系统结构和系统工作原理。然后,针对H.264解码中运动补偿部分存在的问题,提出了一种优化......
针对64位高性能计算,本文简述了如何配置64位编程环境,并对64位SIMD指令作了介绍。通过一个实例验证了利用64位SIMD指令可以较好地......
多媒体技术的迅速发展使得越来越多的处理器集成了SIMD扩展,当前的编译器大多数都已实现了自动向量化功能。为了发掘迭代内并行,一......
ADSP21161是AD公司推出的SHARC二代芯片,它采用单指令多数据流结构,进一步提高了DSP的并行处理能力,可广泛应用于航天、航空、医学......
视频数字信号处理芯片XY-VDSP是采用阵列结构的SIMD处理机.XY-VDSP在硬件结构和指令级上采用高度并行,使其可以高效处理视频应用.......
通用处理器的SIMD(Single Instruction Multiple Data)多媒体扩展,为提高多媒体应用的性能提供了新的体系结构支持。但目前编译技术对......