熵编码算法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:sosmax68
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息时代的到来,由于数据的海量性、计算机存储资源和网络带宽的有限性,数据压缩已经成为数据存储和传输过程中不可或缺的部分。数据压缩是一种在保证重要信息的基础上,降低数据的存储容量,提高计算机资源利用率的技术。熵编码是数据压缩的一种有效手段,大多数用于图像、语音、视频的压缩系统使用自适应预测器或去相关变换,将原始数据块映射为低熵的整数块以便于熵编码过程。常见的熵编码算法有香农编码、Huffman编码、Lempel-Ziv编码、Golomb编码和ANS编码,其中Golomb编码是一种无损数据压缩方法,当输入序列中的符号概率服从几何分布时,使用Gololmb编码可以得到最优的前缀码。给定一个待编码的正整数N,Golomb编码使用一个参数M将其分成两部分:商部分和余数部分。当M不是2的幂次时,这两部分的码字均采用可变长度编码。与固定长度编码相比,可变长度编码的编译码复杂度较高,实现速度较慢。此外,Golomb编码只能采用二进制编码。迄今为止,没有文献研究任意n进制的Golomb编码。ANS编码是一种新的熵编码方法,它有两个主要的实现:rangeANS(rANS)和tabledANS(tANS),其中rANS需要一些复杂的算术运算,包括整数乘法和整数除法,计算复杂度较大。tANS将整个行为(包括重正化)固定到一个查找表中以避免乘法运算,在编码速度与Huffman编码相当的情况下,可以达到算术编码的压缩性能。然而,tANS需要耗费较大空间来存放整个查找表,对CPU的内存要求比较高。Golomb编码和ANS编码都属于可变长度编码,可变长度编码的主要局限性在于缺乏有效的随机访问能力。在数据库领域,经常遇到需要以压缩的形式随机地访问或修改某一个条目的情况。目前国内外在这方面的研究大致可分为两类:(1)基于采样的随机访问机制研究;(2)基于辅助的数据结构的随机访问机制研究。然而,现有的研究都需要开辟额外的空间,额外空间的使用将损失部分压缩性能。本文主要研究文本压缩中的熵编码技术,包括Golomb编码、ANS编码以及可变长度编码中的随机访问应用。首先,本文指出了传统Golomb编码存在的问题,然后提出了一种新的、Golomb编码的变体,它对于任意的M值,始终采用固定长度编码余数部分的码字。此外,本文将二进制的Golomb编码和所提出的编码拓展到任意n进制。接着,针对tANS编码速度快,但查找表耗费空间大的问题,本文提出了一种查找表空间较小的tANS算法,在避免了复杂度较高的乘法运算的同时,解决了内存占用大问题。最后,在不损失压缩性能的前提下,本文提出了一种新的、不需要辅助空间且支持随机访问的解决方案,显著提高了算法的随机访问效率。本文的贡献点如下:1.本文提出了一种Golomb编码的变体,它在不损失压缩性能的前提下,对于任意的M值,始终使用固定长度编码余数部分的码字,显著降低了编译码的复杂度。此外,本文提出了n进制的Golomb编码和n进制所提出的编码。实验结果显示,与传统的Golomb编码相比,所提出的方案编码时减少了20%加法运算、40%的乘法运算,增加了20%的位运算。译码时减少了40%的加法运算、10%的乘法运算,增加了20%的分支判断。2.本文提出了一种查找表空间较小的tANS算法,它在避免乘法运算的同时,减少了查找表所占的空间。此外,本文提出了一种一次可解码多个符号的快速译码算法。实验结果显示,在压缩比略微降低(大约损失0.5%)的情况下,我们的方法在编码(译码)时的吞吐量比rANS大约高25%(60%)。3.本文提出了一种前缀码流的重排方法,它在不需要使用额外空间的情况下,可支持高效的随机访问。实验结果显示,与传统方法相比,所提出的方案随机访问一个元素时需要读取的比特数目大约减少了两个数量级。此外,对于码字长度可由前缀确定的前缀码,如CanonicalHuffman编码,我们的方法可以进一步提高随机访问效率。
其他文献
长期以来,一次风粉精细测量和控制在电厂应用未能很好地解决,导致风粉的调整十分粗放,很大程度上制约了锅炉燃烧优化及调整的效果。本文以鲁阳电厂1号锅炉为例,介绍了该炉采用茵蓝达~非接触式阵列式静电技术的新型风粉精确测量系统、风粉均衡调整、燃烧器配风优化改造的技术,实现了锅炉制粉系统的精细调控和均衡燃烧,再热器等受热面壁温偏差明显减少至很小的范围,CO生成量大幅下降,燃
本试验通过研究淀粉源等比例替代玉米对肉仔鸡生产性能、养分利用率、血液生化指标、肠道发育、肠道pH、食糜黏度、肠道通透性以及肠道葡萄糖转运载体表达量的影响,从不同层面揭示不同淀粉源饲料对肉仔鸡小肠消化吸收的影响,为玉米、小麦、木薯、高粱和豌豆等饲料在家禽饲料中的合理应用提供理论依据。试验选取360只1日龄体重相近、健康无病的雄性科宝肉仔鸡,随机分为5个组,每组6个重复,每重复12只鸡,试验组饲喂玉米
背景与目的:抑郁症是一种具有高度临床异质性的精神疾病,其症状表现可涵盖情感、躯体、认知等多个方面。潜类别分析通过将具有相似症状特征的患者分入同一组中划分出同质性分型,有助于提升对治疗效应和疾病预后的准确评估。本研究目的是通过建立潜类别模型检验抑郁症症状学分型特征及其临床联系。方法:本研究自16所精神专科医院及16所综合性医院精神科门诊和住院部纳入18岁以上、符合DS
目的:探讨血液病致门脉高压的病因、临床特点。方法:对我院血液科2004年~2006年收治的24例血液病致门脉高压患者进行病因统计,并与20例具有门脉高压的肝硬化患者在主要临床表现方面进行比较分析,同时将两组患者的肝功、血常规、PT、APTT及B超检查示脾脏和肝脏有关大小指标的检查结果进行统计学处理,比较采用t检验。结果:24例致门脉高压的血液病患者中慢性粒细胞白血病
本文介绍了美国功能性限定权利要求解释中的等同与等同侵权中的等同的相关规定与历史沿革,并结合相关实践,深入分析两者存在的诸多区别,并通过分析得出结论,即:专利授权、确权与侵权阶段对于功能性限定权利要求解释的规则应当一致且自洽。我国司法解释对于功能性限定权利要求保护范围解释中的等同并未给出判断规则,对于功能性限定的保护过于宽泛,有侵害公众利益之虞;同时,当前我国的相关法
随着我国经济实力和科技水平的快速发展,可穿戴式下肢外骨骼在助老助残、医疗康复等领域得到了广泛的应用,可显著提高肢体功能衰退人群的运动能力和生活质量。近年来下肢外骨骼的研究取得一定成果,但在系统结构设计、步态识别、人机交互以及协同控制等方面仍有很多问题亟待解决,本文围绕下肢外骨骼系统,从下肢外骨骼系统设计与集成,人体步态识别及意图辨识,外骨骼系统控制策略以及外骨骼系统
什么教育最能发展儿童,什么教育能让儿童幸福成长?这次新冠肺炎疫情或许已经给了我们答案。疫情发生后,我曾在第一时间呼吁:停课不停学固然重要,但守住教育的底线、关注教育的本质更重要。作为一名教育工作者,这个时候更重要的是坚守教育的根本,反思教育的目的。面对灾难,我们到底要用什么来教育儿童?我们能不能把疫情灾难作为教材,把危机变成机遇,真正重构我们的教育?面对这场疫情,…
传统高分子材料因其较差的可降解性能,在使用过程中很容易产生环境污染问题。而生物降解高分子材料因其可以无害化分解,逐渐成为现代高分子材料的研发方向。本文对生物降解高分子材料的相关研究进展进行了分析探讨。
第一部分获得性放疗耐受——ATM在乳腺癌放疗耐受中的作用和机制研究临床治疗中,放射耐受可分为治疗过程中产生的耐受和肿瘤内在既有的对放射不敏感。肿瘤细胞放疗耐受性的产生,限制了放射治疗在肿瘤治疗中的疗效。在放疗耐受性产生过程中,许多通路的改变起到了重要的作用,如DNA损伤修复机制、细胞自噬等。研究这些通路在放疗耐受发生过程中的作用,揭示放疗耐受性产生的机制,将有助于发
硕士学位论文(学术学位)变革型领导对一线员工情绪劳动的影响——心理授权的中介作用田莎莎学科门类:管理学一级学科:工商管理二级学科:
学位