红外图像压缩(一)
红外图像,尤其是热红外图像,并不是记录人眼可见光中的颜色纹理,而是记录物体在红外波段的辐射响应;在自动驾驶、安防、医学热成像、遥感和工业检测中,红外图像常被用来补足可见光在黑暗、雾、烟、眩光和恶劣天气下的不足 #FLIR-Dataset。
因此,红外图像压缩的目标也不同于普通 RGB 图像压缩:RGB 压缩通常关心“人看起来是否自然”,而红外压缩还必须关心温度/辐射值是否保真、小目标是否仍可检测、医学或工业诊断是否仍可靠,以及 RGB-IR 多传感器系统中跨模态冗余是否被充分利用 #Mantel-2017 #Bhowmik-2022。
Teledyne FLIR 的 ADAS 热红外数据集面向自动驾驶与高级驾驶辅助系统,官方说明其 starter thermal dataset 可用于训练 CNN 检测模型,并强调热红外可在完全黑暗、雾、烟、恶劣天气和眩光条件下提供可见光之外的补充信息 #FLIR-Dataset。
FLIR 页面列出多个区域版本的数据集:免费 starter dataset 约 14,000 张标注图像,Enhanced San Francisco Dataset 约 10,000 张,Enhanced EU Dataset 约 14,000 张;类别覆盖 car、bike、person、dog、other vehicle,以及增强数据中的 sign、light、truck、bus、hydrant、rider、motorcycle、train 等 #FLIR-Dataset。
| 特性 | 普通 RGB 图像 | 红外 / 热红外图像 | 压缩影响 |
|---|---|---|---|
| 信号含义 | 可见光颜色与纹理 | 红外辐射、温度场或传感器响应 | 失真可能改变测量意义,而不只是视觉质量 |
| 通道结构 | 通常 3 通道 8-bit | 常见单通道,可能 14/16-bit | 不能简单按 8-bit RGB codec 处理 |
| 纹理分布 | 自然纹理丰富 | 低纹理、低对比、热边缘和噪声并存 | 高频项既可能是目标边缘,也可能是传感器噪声 |
| 任务敏感性 | 人眼感知常是主要目标 | 小目标检测、温度误差、医学诊断很关键 | 需要任务驱动或 ROI-aware 的评价 |
Mantel 与 Forchhammer 在研究高 bit-depth 红外图像压缩时指出,许多热传感器输出高于 8-bit 的数据,并比较了 JPEG2000、JPEG-XT 和 HEVC 在红外图像上的表现;该工作用 SNR、MRSE 和 HDR-VDP2 等指标评估,而不只依赖普通 RGB 图像压缩常见的观感判断 #Mantel-2017。
红外压缩的一个难点是数据来源分散:单模态热红外图像、多光谱 RGB-T 图像对、医学热红外图像、红外线扫描图像和遥感高光谱/多光谱数据,其统计特性和任务目标并不相同。
| 数据集 / 来源 | 模态 | 典型用途 | 对压缩研究的价值 |
|---|---|---|---|
| FLIR Thermal ADAS | Thermal + visible | 自动驾驶目标检测 | 适合研究压缩对 mAP、AP_small 的影响 #FLIR-Dataset |
| KAIST Multispectral Pedestrian | RGB-T | 行人检测、多模态融合 | 适合 RGB-IR 联合压缩和跨模态 entropy model #Lu-2022 |
| LLVIP | Low-light visible + IR | 低光监控、RGB-IR 融合 | 2025 CCEM 工作在 LLVIP 上报告了相对 CVPR 2022 codec 的码率节省 #Wang-2025 |
| 医学热红外图像 | Thermal medical | 诊断、热异常分析 | 适合无损/近无损压缩与诊断保真 #Schaefer-2007 |
| 红外线扫描图像 | Line-scanning IR | 工业、遥感、扫描系统 | 适合小波域、RLC、低复杂度实时编码 #HufRLC-2025 |
对于红外图像,传统编码器不是过时基线,而是必须认真比较的工程基线。医学红外图像的无损压缩实验显示,Lossless JPEG、JPEG-LS、JPEG2000、PNG 和 CALIC 等算法都可以用于医学热红外图像;Schaefer 等人在 380 多张医学热红外图像上发现 JPEG-LS 在压缩率和压缩速度上表现最好 #Schaefer-2007。
在高 bit-depth 红外图像上,Mantel 与 Forchhammer 比较 JPEG2000、JPEG-XT 和 HEVC 后报告:JPEG2000 在低于 1.4 bpp 时表现最好,HEVC 在 1.4 到 6.5 bpp 范围内表现最好,并且 HEVC 可以在平均 1.3 bpp 下达到约 1°C 的精度 #Mantel-2017。
| 编码器 | 类型 | 适合场景 | 主要问题 |
|---|---|---|---|
| JPEG | DCT 有损 | 快速、兼容、简单预览 | 块效应明显,小目标和热边缘易受损 |
| JPEG-LS | 无损/近无损预测编码 | 医学热红外、需要精确保真 | 压缩比有限,不适合极低码率 |
| JPEG2000 | 小波,有损/无损 | 高位深、医学、遥感、低 bpp | 复杂度和生态支持问题 |
| HEVC intra | 帧内视频编码 | 高 bit-depth 红外、较高 bpp 区间 | 编码复杂度高,部署较重 |
红外图像往往具有低频能量集中、高频细节稀疏的特点,这使小波域成为传统编码和学习式编码之间很自然的桥梁。2025 年 Sensors 论文 Lossy Infrared Image Compression Based on Wavelet Coefficient Probability Modeling and Run-Length-Enhanced Huffman Coding 针对红外线扫描图像提出 Huf-RLC 方法,动机是 JPEG2000 中 MQ 算术编码器复杂度较高,而稀疏量化小波系数中存在大量连续零 #HufRLC-2025。
Huf-RLC 使用 DWT 小波分解、Run-Length Coding 增强 Huffman 编码、wavelet coefficient probability model 和低频子带 DPCM;摘要报告该方法在 PSNR 和 SSIM 上优于 JPEG,与 JPEG2000 相比只有较小性能损失,并且压缩速度是 JPEG2000 的 3.155 倍、JPEG 的 2.049 倍 #HufRLC-2025。
为什么小波适合红外?
小波把图像分成低频近似和多方向高频细节。红外图像中大面积热背景通常集中在低频,目标边缘和异常热斑进入高频子带;这让编码器可以对背景、边缘、噪声和小目标采用不同的码率策略。
本篇建立了红外图像压缩的物理基础、数据资源和传统编码基线。下一篇 红外图像压缩系列(二) 将讨论学习式图像压缩在红外场景中的局限与改造、RGB-IR 多模态联合压缩、任务驱动压缩的评价体系,以及面向小目标检测的 rate-distortion-accuracy 研究路线。
- Teledyne FLIR OEM. FLIR Thermal Datasets for Algorithm Training. https://oem.flir.com/solutions/automotive/dataset
- Mantel, C., & Forchhammer, S. (2017). Compression of Infrared Images. IS&T Electronic Imaging. PDF
- Schaefer, G. et al. An evaluation of lossless compression algorithms for medical infrared images. PubMed abstract. https://pubmed.ncbi.nlm.nih.gov/17282533/
- Zhang et al. (2025). Lossy Infrared Image Compression Based on Wavelet Coefficient Probability Modeling and Run-Length-Enhanced Huffman Coding. Sensors. PubMed; MDPI