图像压缩基础系列总览
从信息论到 AI 生成 · 7 篇系列
理解比特如何被节省——从香农到扩散模型
Introduction · 系列说明
为什么需要理解压缩?
每一张照片、每一段视频的背后,都有一套精密的数学在决定"哪些信息可以丢弃,哪些必须保留"。图像视频压缩是信息论最成功的工程实践之一:JPEG 标准让互联网图片成为可能,H.264 让在线视频普及全球,而神经网络压缩正在重新定义"压缩"的边界。
这个系列从信息论基础出发,沿着技术演进的时间线,系统梳理了传统压缩(无损/有损图像编码、小波变换、现代格式、视频编码标准)和基于机器学习的压缩方法。目标是建立完整的知识框架:不只是"知道某个算法",而是理解"为什么是这些算法,它们之间有什么联系,未来会走向哪里"。
📅 技术演进时间线
排序:
2013 — 至今
下一代视频编码与 AI 压缩
核心问题:压缩和生成的边界在哪里?
文章关系图
43 篇文章 · 62 条连接
📚 完整目录
- 01 图像压缩基础系列(一):信息论与无损压缩,从香农到 PNG ✓ 已完成
- 02 图像压缩基础系列(二):JPEG 与 DCT,有损压缩的核心算法 ✓ 已完成
- 03 图像压缩基础系列(三):小波变换与 JPEG2000,多分辨率分析的压缩革命 ✓ 已完成
- 04 图像压缩基础系列(四):现代图像格式,WebP、AVIF 与 BPG ✓ 已完成
- 05 图像压缩基础系列(五):视频压缩基础,从 MPEG-1 到 H.264/AVC ✓ 已完成
- 06 图像压缩基础系列(六):H.265/HEVC、AV1 与下一代视频编码 ✓ 已完成
- 07 图像压缩基础系列(七):机器学习压缩,从 VAE 到扩散模型 ✓ 已完成
🗺️ 阅读路径
路径一:完整学习
路径二:图像压缩速览
路径三:视频编码专题
路径四:AI 压缩前沿
📚 核心参考资源
| 资源 | 类型 | 说明 |
|---|---|---|
| Shannon (1948) | 开创性论文 | 信息论与熵编码的数学基础 |
| ITU-T T.81 (JPEG) | 国际标准 | JPEG 压缩的完整规范 |
| ISO/IEC 15444-1 (JPEG2000) | 国际标准 | JPEG2000 核心编码系统 |
| ITU-T H.264/H.265 | 国际标准 | 视频编码标准 |
| AOM AV1 Spec | 开放标准 | AV1 视频编码规范 |
| Ballé et al. (2017, 2018) | 顶会论文 | 端到端学习式压缩的奠基工作 |
| Cheng et al. (2020, 2022) | 顶会论文 | 量化 VAE 与 ELIC 模型 |