深度学习图像压缩：Variational image compression with a scale hyperprior 笔记

本系列文章由@邻居张师傅出品，转载请注明出处。

文章链接： https://blog.csdn.net/qq_39120048/article/details/117753592

邮箱： zhangyh.nb@qq.com

ABSTRACT

论文描述基于变分自编码器的图像压缩端到端可训练模型。
该模型采用超优先级（hyperprior），以有效捕获潜在表示（即图像向量 x 的另一种表示 y ）的空间依赖性。

在这里插入图片描述

KL散度的最小化等效于优化压缩模型的rate-distortion性能

在这里插入图片描述

左侧显示了图像自编码器架构（End-to-end Optimized Image Compression 论文中的网络结构）
右侧对应于实现hyperior的自编码器

能更好的得到压缩后的图像/点云，实现最优压缩，去除冗余
例如：
在这里插入图片描述

左图是《End-to-end Optimized Image Compression》论文中的框架（factorized-prior model），边缘处存在冗余
右图是在左图基础上引入hyperior的框架，去除了图像的冗余

《End-to-end Optimized Image Compression》论文中rate-distortion优化可以转化为变分编码器