分片式处理器上谓词执行技术的实现与优化

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:scotscotscotscot
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机体系结构和工艺的发展,计算机性能提升的方式由提高主频变为增加处理器核数。处理器资源匮乏的问题得以缓解,随之而来的问题是如何在功耗允许的情况下合理使用这些资源来获得最大性能。分片式处理器体系结构将计算资源和存储资源均匀分布在整个芯片上,解决了现代处理器设计中面临的存储墙、资源利用率、线延迟和可扩展性等问题,成为微处理器体系结构发展的一种趋势。本文为分片式处理器TPA-PI实现了编译器后端的谓词执行技术,并对其执行过程进行优化。主要研究工作和成果包括:(1)研究了基于LLVM编译框架的后端实现技术,实现了适合TPA-PI处理器的谓词执行技术。该技术对程序的控制流图进行遍历,寻找谓词执行的候选块,再根据图中节点的依赖关系对候选块进行谓词化操作。(2)研究了超块构造中基本块选择的过程,分析了选择过程中程序各因素对其的影响,利用剖析信息对基本块的选取过程进行动态决策。(3)研究了影响超块分裂的各种因素,为超块分裂技术提供了启发式选择算法。通过衡量超块分裂的执行开销和分裂后的超块质量,为超块分裂节点的选取提供评判标准,以改进超块的执行效率,提高处理器的整体执行性能。初步实验表明,本文设计的谓词执行技术能够有效地消除分支指令,合并程序中的指令块。而对谓词执行技术进行的改进使测试程序的分支命中率提高了0.68%~3%,程序的整体性能提高了1.67%~8.39%。本文的研究工作为分片式处理器TPA-PI实现了谓词执行技术,为编译器后端的整体设计打下了基础。同时本文提出的优化技术也为在编译系统中提高处理器的指令级并行性提供了参考。
其他文献
伴随着网络等各种技术的快速发展,便携式的计算机和掌上电脑等无线终端使用越来越普遍,无线通信技术也得到迅猛的发展。但在一些特殊的场合,如发生洪灾、大的地质灾难、战争
随着信息时代的高速发展,推荐系统已成为电子商务领域不可或缺的一部分。推荐系统是为用户做信息过滤,通过预测得到用户潜在的兴趣产品。协同过滤作为解决信息过载的有效方法之
计算机网络规模日趋庞大,计算机技术的高速发展给网络安全现状带来严峻的挑战:网络攻击的复杂程度呈不断上升,而攻击者所需的知识水平呈不断下降的趋势。为了应对强大的网络攻
无线传感器网络是当前计算机网络领域一个极为重要的课题,在军事国防、环境监测、生物医疗以及商业应用等领域具有广阔的应用前景。传感器节点的能量有限,极大的影响了网络的
知道某事物的样本数据却不知其类标号属性时,一般只能对样本集进行聚类分析,但是聚类的结果在很多情况下是无法直接解决问题的。相反决策树算法以高准确性和实用性著称,但是
随着人工智能的发展和计算机性能的大幅提商,人们希望机器也能像人类一样具备情感智能,以进一步消除人机交互的障碍。因此近年来,情感计算越来越受到大家的重视,所谓的情感计算就
基于通信的列车控制(CommunicationbasedTrainControl,CBTC)系统通过车-地双向数据通信方式对列车进行控制和监督,增强了列车运行的安全,提高了列车的运输效率,是列车控制系统的
人工神经网络(ANN)局部搜索能力强,可以表达复杂的非线性关系。在解决许多实际问题上如过程控制、故障诊断、系统辨识有独到的优势。但同时也存在着收敛速度慢,效率不高等缺点
随着Web发展,已形成大量的RDF数据。RDF数据可信问题已成为Web研究领域的热点。本文综合RDF数据内容本身、Provenance信息以及语义社会网络对RDF数据进行可信评价。   本文