基于机器学习的多维数据压缩算法研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:jokylin1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统基于字典学习的视频编码系统总是忽略其信号本身的特征分布,从而导致了很高的计算复杂度,降低了编码效率。本文提出了一种基于时空在线字典学习算法()来加速字典学习的收敛速度,并保证了一定的估计误差。所述算法利用随机梯度下降法来构造三维高频与低频的时空字典对。在每次的学习迭代过程中,基于块梯度下降法学习算法优化全部训练集样本所产生的经验代价,例如。与之不同的是,随机梯度下降法随机地选择一个训练集样本,基于该样本更新字典原子最小化近似期望代价。由于训练集中的样本假设为独立同分布,稀疏表示分解系数可以通过训练字典得到。相较于算法,本文所提出的基于时空在线字典学习算法理论上可以证明有更近似的稀疏表示,并能保持视频信号的结构化稀疏以及层间稀疏性。同时,随机梯度下降法比批量梯度下降法有着更快的收敛速度以及更低的计算复杂度,其预测误差上限渐近地逼近训练误差。大量实验证明,计算复杂度的降低能够使基于时空在线字典学习的编码框架比现有基于超分辨率的编码方案以及标准编码器H.264、HEVC有着更好的客观、主观质量以及率失真表现。进一步地,利用结构化稀疏的机器学习,本文提出了一种新的基于多尺度在线字典学习算法的质量可分级视频编码框架。通过小波变换对图像特征的层次化结构进行分解,将在线学习的搜索域优化为带有层次化稀疏的区块。其中,基本层低频子带利用图像组稀疏特征来获得低频子字典以及稀疏表示系数。可以证明,所设计的跨尺度分解重构质量可由一个有上界的估计误差保证。在字典优化模块,通过随机梯度下降法直接更新期望代价而不是经验代价来降低计算复杂度。层次化的高频结构信息通过一个预先学习的子字典对来进行预测,实现可分级视频编码的目的。实验证明,所述算法能够渐进地实现质量可分级性。对于不同传输环境的异构网络,本文提出了一种基于渐进式字典学习的时间可分级视频编码框架。通过可分级帧预测结构,视频帧可以基于预先学习的时空字典连续重构得到。在所述的渐进式字典学习算法中,随着重构增强层的增加,重构视频帧提供了更多样本来优化学习字典。在实际编码中,通过直接最小化期望代价,基于随机梯度下降法的字典更新极大的降低了编码复杂度。可以证明,基于渐进式时空字典学习的可分级视频编码框架能够有效地保证视频中的运动一致性。
其他文献
舰船目标在军事上是一类重要的、有价值的目标,本文主要研究舰船目标逆合成孔径雷达(ISAR)成像方法及实时处理软件的实现。   舰船目标成像时,由于存在平动和随机的三维转动
近年来,由于传统航空总线MIL-STD-1553已经不能满足高速通信的要求,在原有总线基础上开发高速通讯接口具有重要意义。OFDM技术具有高数据传输速率,高频谱利用率等优点,因此,
近年来,粒子群优化(Particle Swarm Optimization,PSO)算法这种模仿生物行为的智能优化算法,得到了较快的发展。因为具有较少的参数,并且概念容易理解,编码方便,所以人们将它
异构无线网络中,日益增长的服务需求使得异构网络日趋复杂,网络中的基站类型越来越多样,微蜂窝、微微蜂窝以及家庭蜂窝等各类型基站并存,且异构网络区域内基站数量也总在不断的增
随着通信技术的快速发展,新的无线网络不断诞生并提供较好的服务质量,异构融合网络是下一代无线网络发展的趋势。异构网络融合背景下,需要对现有的无线网络资源合理利用和管理。
CDMA是第三代移动通信系统中三种主流制式采用的核心技术,随着用户数目的增加,多址干扰成为CDMA中最主要的干扰。多用户检测作为第三代移动通信中消除多址干扰的关键技术之一
非刚体三维重建,主要研究的是如何从一组非刚体的二维动态图像序列中恢复出摄像机的运动参数和非刚体的三维结构。该技术在战地侦察、医疗成像以及体育训练等领域有着广泛的
从第二次世界大战开始,雷达由于军事上的迫切需求登上历史舞台。经过几十年的发展,雷达技术及其性能日趋完善。测速、测距、测角是雷达最基本的功能。随着技术不断提高,新体