并行度相关论文
针对稀疏矩阵向量乘(Sparse Matrix-Vector Multiplication,SpMV)在边缘端实施效率不高的问题,以稀疏矩阵的存储格式、SpMV的FPGA加速......
大数据量FFT广泛应用于雷达信号处理领域,本文通过将Cordic[1]算法引入到FFT[2]运算中,用来完成复数乘加功能,从而减少了旋转因子(......
FPGA越来越多地用于实现各种DSP运算,而FFT是DSP中复杂度最高、最为典型和常用的一种运算.用FPGA实现FFT存在存储器瓶颈问题,严重......
现在现场可编程门阵列(Field Programmable Gate Array,FPGA)已经被广泛得应用于数字信号处理(Digital Signal Processing,DSP)领......
CRC校验的实现基于串行移位寄存器,如要处理并行数据,需对电路进行改进.本文介绍了一种并行CRC电路HDL代码的快速生成种算法,只需......
总参通信部袁邦根副部长一行来校参观访问衡量任务粒度大小的一个依据是程序用于有效计算的执行时间E与处理机间的通讯等辅助开销时......
VLSI集成度的飞速提高使设计过程复杂化,也对版图验证工具的处理能力与性能提出更高的要求。将版图验证的核心算法固化在专用硬件上,是一......
分析了CIMS环境下某纺织机械厂的并行运营机制和人工神经网络(ANN)辅助企业运营管理的方式,给出了支持CIMS企业并行运营决策支持系......
余数系统由于其优良的并行计算特性,在乘加密集型的数字信号处理系统中得到了深入研究和关注.余数基的选择和构建是余数系统应用中......
新近发展起来的LB方法具有并行度高、几何边界易处理等优点.作为用之解决实际问题的尝试,本文建立了能模拟水电站水击的一维LB模型,给出了......
随着多媒体时代的来临,视频编解码作为一门音视频产业所依赖的共性技术而被广泛关注。微软公司提出的VC-1视频编解码标准是第三代高......
作为一种编程模型,MapReduce已经成为处理大规模数据处理问题的一个重要手段。目前,MapReduce已被广泛地应用于Web搜索,机器学习,......
对于指令级并行处理器(ILP,instruction level parallelism),在执行不同应用程式时,硬件资源的需求量差异很大,甚至在同一支程式中......
钱搜索是与非型闪速(NAND flash)存储器中BCH译码器的重要组成部分,并行钱搜索延迟较小并可高速运行,但过高的复杂度制约了其的应......
本文提出了一种双层多中心多目发送保序机制,并在以太网和工作站环境中实现.通过将本方法与现有集中式、分布式和树型方式的比较以及......
从通信路径长度、通信并行度、通信接口数、路径算法复杂度和强健性五个方面对三种典型分布式计算机系统的互连结构进行了研究
Th......
法国THOMSON—CSF部CIMSA公司正在研制的相联并行处理机PROPAL2系统是一个由128—2048个很简单的处理器单元所构成的计算机群,197......
151-3型机变结构运算系统由16个单元的通用寄存器J_L、两个32位的运算器A和A’,以及它们各自的运算控制器等组成。根据需要或设备......
本文介绍了Manchester数据流样机的总体结构和工作过程,并着重对其关键部件的设计进行了分析。Manchester数据流机的硬件设计充分......
全息研究人员在六十年代犯了一个疏忽性的错误,因而在七十年代付出很高的代价:我们让自己无可非议的热情驱使我们低估了将来的困......
本文首先提出一个能够支持多分支循环程序最优执行的VLIW体系结构模型,然后在这个模型的基础上设计了一个新的主要用于数字信号处理及图......
本文用组织数学的组合与递归方法,对调度队列中前k个请求后的找道距离之和进行了分析,并求得FCFS调度时的平均找道距离是(k2-1)/3,而K-SC......
把软件流水技术与硬件流水技术相结合可以大幅度提高处理机的运算速度和性能价格比;然而,在多分支程序中,常规的方法会引起空间开销的......
提出了一种新的并行扫描结构。扫描触发器的选择采用BALLAST算法。该结构采用译码的方式依次选通每个扫描小组,使得扫描小组中的存储元件并......
2D/1D耦合方法求解三维输运方程具有快速、精确的优点;通常的2D/1D耦合方法利用轴向和角度方面的并行度,不能进行大规模并行计算。......
在分析了声纳信号并行处理的几种形式后,结合自适应格型算法阶递归的特点,采用多片数字信号处理器(TMS320C25)设计了一个MIMD并行处理器系统。应用该......
本文设计实现了LICOM2系统的ADIOS并行读写方案,都取得了显著的优化效果.LICOM2系统ADIOS优化在天河1A系统内网测试,在288-6480并......
图形渲染中涉及的几何变换、投影变换、视口变换等需要大量稀疏矩阵向量乘法(Sparse Matrix-Vector Multiplication,SpM V)运算,如......
单级互连网络是由一组二输入和二输出的开关元件按一定连接模式而组成的动态互连网络.它本质上是一种集中式开关网络,用来为其输......
近年来关于单个DAG在异构分布式环境下的调度研究已经取得了很大进展并提出了很多调度算法,但这些算法不能直接运用于多DAG的调度,......
基于CPU平台的多棱微处理器并行模拟已经受到硬件自身并行度的限制而发展缓慢.在本文中,以超标量SimpleScalar模拟器为例,利用NVid......
会议
本文提出了一种基于循环移位寄存器的码率可变的LDPC码编码器。 用循环移位寄存器替代双口RAM作为码元的存储单元,降低了编码器......
本文针对准循环LDPC(low-density parity check)码的编码问题提出了一种高速并行结构。通常LDPC 码不适于设计高并行度高吞吐率的编......
Master-Worker模型广泛地被用于分布式并行程序的开发。但是,在动态、异构的计算环境中高效地实现Master-Worker应用是困难的,有效的......
本文探讨了在系统级和模块级提高指令执行的并行度、减小关键路径延时,以提高双精度浮点乘法器的性能的优化方法;在设计中通过异常......
本文提出利用RISC|TTA双模式计算提高TTA代码密度:程序中的关键循环运算量大,并行度高,在TTA模式下计算以获得较高的性能;其余部分......
本文提出了一种求解TSP问题的分布式并行演化算法,和其他的求解TSP问题的演化算法不同的是,算法只使用了变异算子.算法采用了主-从......
近年来光技术发展迅速,应用领域不断扩大.光传输具有高并行度、高带宽和很强的抗干扰性能,但在使用过程由于光信号难以缓冲,从而限......
本文针对对象关系数据库PostgreSQL中固定顺序执行规划树的不足,采用各种策略划分规划树,提出多用线程实现规划树上的每个划分使其......
本文提出的新的索引结构和算法兼顾了空间效率和时间效率,有广泛的现实意义,比如现在的网络查询都有二次查询的策略,但是这方面仍......