深度学习图像压缩:Variational image compression with a scale hyperprior 笔记

  • Post author:
  • Post category:其他


本系列文章由@邻居张师傅 出品,转载请注明出处。

文章链接: https://blog.csdn.net/qq_39120048/article/details/117753592

邮箱: zhangyh.nb@qq.com



论文地址:Variational image compression with a scale hyperprior


ABSTRACT

论文描述基于变分自编码器的图像压缩端到端可训练模型。
该模型采用超优先级(hyperprior),以有效捕获潜在表示(即图像向量 x 的另一种表示 y )的空间依赖性。


1 INTRODUCTION

在这里插入图片描述

2 COMPRESSION WITH VARIATIONAL MODELS

KL散度的最小化等效于优化压缩模型的rate-distortion性能

3 INTRODUCTION OF A SCALE HYPERPRIOR

在这里插入图片描述

左侧显示了图像自编码器架构(End-to-end Optimized Image Compression 论文中的网络结构)
右侧对应于实现hyperior的自编码器

理解

引入hyperior的目的

能更好的得到压缩后的图像/点云,实现最优压缩,去除冗余
例如:
在这里插入图片描述

左图是《End-to-end Optimized Image Compression》论文中的框架(factorized-prior model),边缘处存在冗余
右图是在左图基础上引入hyperior的框架,去除了图像的冗余

变分编码器和rate-distortion优化的关系

《End-to-end Optimized Image Compression》论文中rate-distortion优化可以转化为变分编码器

参考

深度学习与视频编解码算法一
c语言图像压缩算法实现_Image Compression 图像压缩
端到端的图像压缩—-《Variational Image Compression With A Scale Hyperprior》论文笔记


版权声明:本文为qq_39120048原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。