高精度浮点正余弦和反正切函数运算单元硬件建模

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户：g2gstock

【摘要】

：

在导航、雷达等数字信号处理领域,需要大量正余弦和反正切函数计算,目前主要的手段是采用FPGA并行完成。硬件设计方案主要包括查表法、多项式逼近方法和坐标旋转数字计算方法

【作者】

：

后楠欣

【出处】

：

哈尔滨工业大学

【发表日期】

：

2004年期

【关键词】

：

CORDIC算法 128位标准浮点正余弦函数反正切函数硬件设计

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在导航、雷达等数字信号处理领域,需要大量正余弦和反正切函数计算,目前主要的手段是采用FPGA并行完成。硬件设计方案主要包括查表法、多项式逼近方法和坐标旋转数字计算方法（Coordinate Rotation Digital Computer,CORDIC）;随着精度要求的提高,查表法和多项式逼近法硬件资源消耗成指数增加;CORDIC算法可以通过移位和相加计算三角函数和超越函数,是高精度正余弦和反正切函数计算的首选硬件算法。目前正余弦和反正切函数计算精度主要包括定点、单精度浮点和双精度浮点,针对128位浮点的计算硬件实现研究还较少。本文基于CORDIC算法,开展128位高精度浮点正余弦和反正切函数并行计算的硬件结构研究,论文研究对于雷达、导航、天气等高精度快速超函数计算需求具有重要价值。为了减少迭代次数,提高运算速度,本文设计了针对正余弦和反正切函数计算的四步并行分支迭代CORDIC算法。在传统CORDIC算法的单步迭代基础上,改进为每个周期完成四步迭代计算。在每个时钟周期内,并行计算x,y,z的16种可能情况,预测出下一个四步迭代的符号因子。要达到128位浮点标准的113 bit精度,传统CORDIC算法需要经过113个时钟周期,而改进后的四步并行分支迭代CORDIC算法只需32个时钟周期即可完成计算。论文分别设计了正余弦和反正切函数并行计算的硬件结构。浮点正余弦和反正切函数运算单元的硬件结构都包含三个模块:预处理模块、四步并行迭代模块和后处理模块。预处理模块负责对输入异常角度进行处理,将输入的浮点角度转换为CORDIC算法可计算的收敛范围;四步并行迭代模块是核心模块,将改进后的四步并行分支迭代CORDIC算法进行硬件实现;后处理模块中包含前导零检测、归一化等,并结合象限映射的结果,将定点计算结果转化为标准的浮点输出。论文中函数的硬件建模使用Verilog进行编写,利用Modelsim平台,对设计进行验证仿真,最后在TSMC65 nm工艺下进行DC综合。在测试过程中,利用Python平台生成128位浮点的随机数据,并生成理想计算结果,与本次硬件建模中的仿真结果进行了大量的数据对比。测试结果显示,对于正余弦函数,在输入数值指数[2^-11,2¹³]的范围内,最大计算误差不超过1 bit。反正切函数浮点运算单元在输入数值y/x的指数比值大于2-10的情况下,最大误差不超过1 bit,两者均能达到高精度要求。两个运算单元的计算周期仅为32个周期,在500MHz的工作频率下,正余弦函数运算单元的硬件面积约为0.75 mm²,硬件功耗约为75.57 m W,反正切函数运算单元的硬件面积约为0.63 mm²,硬件功耗约为40.65 m W。综上,本次设计实现了预期目标,完成了高精度浮点正余弦和反正切函数运算单元的硬件建模。

其他文献

弛豫介质中两束不同功率的耦合脉冲的调制不稳定性研究

在非线性光纤光学中,两束初始功率不同的耦合脉冲在光纤中同时传输时,耦合脉冲之间的相互非线性作用导致两束脉冲在时间、空间以及频域都发生了很大的变化,而在这些变化中调

学位

耦合脉冲非线性调制不稳定性弛豫介质功率比

探索APOS理论用于高中数学命题课教学的实践研究

数学源于对现实世界的抽象,基于抽象结构,通过符号运算、形式推理、模型构建等,理解和表达现实世界中事物的本质、关系和规律。以学习数学公理、定理、法则、公式和性质等为

学位

高中数学命题教学APOS理论教学策略

基于u-shapelets的时间序列聚类方法及其在空气质量分析中的应用

随着互联网技术的迅速发展,数据呈指数增长,这些数据大多以时间序列形式存在,所以面向时间序列数据的挖掘技术与方法受到了广泛的重视。由于时间序列数据存在海量性、高维性

学位

时间序列u-shapelets聚类方法空气质量指标

论刑事诉讼中的个人信息保护

刑事诉讼的工作之一就是惩罚犯罪,虽然刑事诉讼制度早就存在,并且在实践中广泛渗透到每个人的生活之中,但其与个人信息保护之间的关系并没有得到普遍的关注,学界也多以“个人

学位

刑事诉讼个人信息保护

大图中图元统计量的估算算法

图元(Graphlet)是大图中连通的诱导子图,因其广泛的应用吸引着众多研究者的关注。图元的统计量,即图元的数目和比例可以揭示出大图的某些特征,是研究复杂网络的一个很好的切

学位

图元统计量估算限制性访问图元比例

室内动态场景视觉SLAM系统中的弱监督语义分割方法研究

视觉SLAM(Visual Simultaneous Localization and Mapping,VSLAM)是移动机器人领域的重要技术,使得移动机器人更具智能化。目前的视觉SLAM算法大多是基于静态环境实现的,如果

学位

视觉SLAM动态场景弱监督语义分割八叉树地图

云盘服务中著作权侵权问题研究

云盘作为当前网络资源传播的重要渠道之一,不可避免的成为著作权侵权的重灾区。云盘服务向用户提供的空间存储、资源分享、在线预览和秒传等功能服务方便了用户之间作品资源

学位

云盘服务著作权直接侵权著作权间接侵权侵权规则著作权保护

5G D2D模式选择与资源分配算法研究

随着通信技术的进步,用户和应用的数量呈指数级增长,导致了资源的稀缺和功耗的增加。基站上的数据流量也随着用户数量的增加而增加。为了降低5G中蜂窝用户的中断概率,设备到

学位

5GD2D通信模式选择资源分配基站负载联合选择

基于性别因素引起的高中物理学习效能差异及其教学对策研究

物理学科是一门综合性极强的自然学科。高中物理学科知识结构体系全面,涵盖的知识点丰富,涉及的领域广泛,对学生的综合能力有着极高的要求。“学习物理难、学好物理更难”越

学位

性别差异高中物理学习效能教学对策

标准贯人法在检测饱和砂土液化中的应用

高烈度地震区地震液化对各种工程建设都有相当大的危害,用标准贯入试验判断饱和砂土地震液化,能为工程抗震设计提供重要依据。本文通过对标准贯入试验的理论研究,结合具体工

会议

贯入法饱和砂土检测液化应用

高精度浮点正余弦和反正切函数运算单元硬件建模

其他学术论文