红外图像压缩系列
红外图像压缩是图像压缩研究中一个高度专业化的子领域。与可见光图像不同,红外图像承载的是场景的热辐射分布而非反射光谱——这意味着压缩的目标函数、评价体系和工程约束都有本质差异。
在军事侦察、工业检测、医疗诊断、自动驾驶夜视和空间遥感等应用场景中,红外图像的压缩不仅要追求 PSNR 或 MS-SSIM 等传统保真度指标,更要在极低码率下保留对下游任务(目标检测、温度反演、小目标识别、跨模态配准)真正关键的信息结构。
本系列从四个维度系统梳理红外图像压缩的完整研究路线:
- 系列(一):成像物理原理、公开数据集与传统编码基线(JPEG2000、DWT、Huf-RLC),为后续讨论建立共同语言
- 系列(二):学习式压缩与多模态联合压缩前沿,探讨 RGB-IR 联合编码、任务驱动评价(ICM)以及端到端优化框架如何适配红外的特殊统计特性
- 系列(三):边缘与轮廓压缩这条独特技术线,从 JBIG、CCITT G4、链码等经典二值编码方法出发,延伸到 Coding for Machines 范式下轮廓信息的语义级压缩
- 系列(四):CV 前沿方法的借鉴,包括基础模型(SAM、DINOv2)在红外特征提取中的应用、频域分解揭示的高低频分歧、RPCA 稀疏-低秩分解以及扩散模型在红外图像复原中的潜力
除四篇综述性正文外,系列还包含八篇独立论文精读笔记,分别深入解读 Huf-RLC(Sensors 2025)、SA-ICM(ICIP 2024)、FreqKD(arXiv 2026)、AnyThermal(arXiv 2026)、CI-ICM(arXiv 2026)、LoHGNet(arXiv 2026,CV 前沿借鉴)、RPCASSM(arXiv 2026,红外小目标检测)和 SPIRE(arXiv 2026,单点监督 encoder-only 检测),每篇精读都提供方法论拆解、实验复现要点以及与系列正文的交叉引用。
本系列隶属于站内更大的「图像压缩」subcategory,占据 sub_id 3000–3599 编号段,与熵模型演化、生成式压缩、Token-based 压缩等主线形成互补。
| 术语 | 全称 / 释义 | 在本系列中的角色 |
|---|---|---|
| IR / Thermal IR | Infrared / Thermal Infrared,红外 / 热红外 | 系列核心对象,泛指所有红外波段成像 |
| LWIR | Long-Wave Infrared(8–14 μm) | 热成像主力波段,室温物体峰值辐射所在 |
| MWIR | Mid-Wave Infrared(3–5 μm) | 高温目标探测、导弹预警常用波段 |
| SWIR | Short-Wave Infrared(0.9–1.7 μm) | 近红外反射成像,兼具可见光纹理与穿透能力 |
| Contour / Edge map | 轮廓图 / 边缘图 | 红外图像中目标识别的关键中间表征 |
| JBIG | Joint Bi-level Image Experts Group | 二值图像无损/近无损压缩国际标准 |
| CCITT G4 | ITU-T T.6 传真压缩标准 | 基于 Modified READ 的二值游程编码 |
| Chain code | Freeman 链码 | 用方向序列表示轮廓的经典编码方法 |
| LIC | Learned Image Compression | 端到端学习式图像压缩的统称 |
| ICM | Image Coding for Machines | 面向机器视觉任务的压缩范式,优化下游准确率而非像素保真度 |
| R-D-A | Rate-Distortion-Accuracy | ICM 的核心优化目标,扩展了经典 R-D 理论 |
| RPCA | Robust PCA | 将图像分解为低秩分量 + 稀疏分量的矩阵分解方法 |
| Freq. decomposition | 频率分解(FFT / Gaussian subtraction) | 分离红外图像高频细节与低频背景的预处理手段 |
- 01 红外图像压缩系列(一):成像原理、数据集与传统编码基线 ✓ 已完成
- 02 红外图像压缩系列(二):学习式压缩、多模态联合压缩与任务驱动评价 ✓ 已完成
- 03 红外图像压缩系列(三):边缘与轮廓压缩 — 从二值编码到 Coding for Machines ✓ 已完成
- 04 红外图像压缩系列(四):CV 前沿方法借鉴 — 基础模型、频域分解、稀疏表征与扩散复原 ✓ 已完成
- 精读 01 Huf-RLC:用零游程修补 Huffman 在红外线扫图像压缩中的短板 ✓ Sensors 2025
- 精读 02 SA-ICM:用 SAM 边缘信息训练给机器看的图像压缩器 ✓ ICIP 2024
- 精读 03 FreqKD:频率解耦蒸馏揭示红外图像的高低频分歧 ✓ arXiv 2026
- 精读 04 AnyThermal:跨模态蒸馏构建通用热红外特征骨干 ✓ arXiv 2026
- 精读 05 CI-ICM:通道重要性驱动的面向机器图像压缩 ✓ arXiv 2026
- 精读 06 LoHGNet:洛伦兹几何编码与高阶关系学习(IRSTD 检测的 CV 前沿借鉴) ✓ arXiv 2026
- 精读 07 RPCASSM:鲁棒 PCA 状态空间模型的红外小目标检测 ✓ arXiv 2026
- 精读 08 SPIRE:单点监督引导的编码器红外小目标检测 ✓ arXiv 2026
路径一:快速了解(2–3 小时)
Hub → 系列(一)概览成像原理与传统基线 → 系列(四)路线图把握 CV 前沿方向。适合已有图像压缩基础、想快速建立红外压缩认知框架的研究者。
路径二:系统学习
Hub → 系列(一)→ 系列(二)→ 系列(三)→ 系列(四),逐篇通读正文并跟进每篇引用的核心文献。适合准备进入红外压缩领域的研究生。建议配合七篇精读笔记同步阅读。
路径三:论文驱动
Hub → 精读系列 01–05,按研究兴趣选读,再回溯正文获取上下文。关注传统编码改进可从精读 01(Huf-RLC)入手;关注 ICM 可从精读 02(SA-ICM)和精读 05(CI-ICM)切入;关注频域方法则优先精读 03(FreqKD)和精读 04(AnyThermal)。
- Sensors 2025 · ICIP 2024
- arXiv 2026 × 6
- 传统编码 → ICM → 频域 → 基础模型 → CV 前沿 → 单点监督检测
文章关系图
43 篇文章 · 62 条连接