ESC
输入关键词搜索文章
目录

受干扰图像传输旧索引

从分离编码到生成式语义通信的技术演进
当信道不再可靠,图像如何抵达?
Introduction · 研究说明
为什么研究这个?

无线通信、工业检测(电缆缺陷扫描)、IoT 传感等场景中,图像数据必须在带宽受限且存在噪声、衰落、丢包的信道上传输。传统 Shannon 分离编码在低 SNR 下存在"悬崖效应"——信道质量低于阈值后重建质量断崖式下降。

本专题追踪一条清晰的技术脉络:端到端 Deep JSCC → 信道自适应 → 扩散模型生成式语义通信。这个枢纽页锚定研究方向、梳理分期框架、积累专题资源。

📅 技术分期
2019 — 2022
第一阶段:Deep JSCC

用端到端神经网络替代传统"压缩+纠错"分离管线。编码器将图像直接映射到信道符号,解码器从接收信号重建图像。消除悬崖效应,低 SNR 下显著优于 JPEG+LDPC。

关键问题:如何让神经网络编解码器同时学会压缩和抗噪声?

  • DeepJSCC (Erdogan et al., 2019)
  • AIB-JSCC — 信息瓶颈引导自适应码率
  • CNN 自编码器架构 + GDN 激活
2022 — 2023
第二阶段:Transformer + 信道自适应

架构从 CNN 升级到 Swin Transformer,显著提升高分辨率图像传输质量。引入 SNR 自适应模块和信道反馈机制,使单一模型覆盖多种信道条件。多任务(恢复+分类)联合优化出现。

关键问题:如何在未知/时变信道条件下保持传输质量?

  • WITT — Swin Transformer + SNR 自适应模块
  • SCAN — 语义失真中断概率 (SDOP)
  • Deep JSCC Multi-task — 恢复 + 分类联合
2023 — 2024
第三阶段:扩散模型生成式语义通信

将扩散模型引入解码端,信道噪声被天然地融入去噪过程。接收端不再是"恢复"像素,而是"生成"语义一致的图像。在极低 SNR 下仍能产生高感知质量重建。

关键问题:去噪过程的计算开销如何满足实时需求?

  • GESCO — 扩散模型语义通信
  • CDDM — 信道去噪扩散模型
  • DiffJSCC — 扩散辅助高真实感传输
  • Gen-SC — 文本传输 + 扩散生成(压缩 99%)
2024 — 至今
第四阶段:多任务 + 工业场景适配

从单一图像恢复扩展到联合恢复/分割/检测;从标准 AWGN 信道扩展到脉冲噪声、电磁干扰等非标准信道模型。工业检测等垂直领域的特殊需求开始被关注。

关键问题:工业场景下如何保留任务关键的细微特征(如缺陷纹理)?

  • Gen-SC Multi-task — 重建 + 分割联合
  • Consistency Models / LCM 快速生成
  • 工业信道建模(脉冲噪声、部分放电干扰)
📚 核心论文索引
论文年份核心贡献链接
DeepJSCC2019首个端到端 Deep JSCC 图像传输
AIB-JSCC2022信息瓶颈引导自适应码率 JSCCarXiv
DVST2022深度视频语义传输
WITT2023Swin Transformer + SNR 自适应ICASSP 2023
GESCO2023扩散模型语义通信,极低 SNR 语义可识别arXiv
SCAN2023语义失真中断概率 (SDOP) 指标arXiv
Deep JSCC Multi-task2023多任务联合(恢复 + 分类)arXiv
CDDM2024信道去噪扩散模型
DiffJSCC2024扩散辅助高真实感无线图像传输GitHub
Gen-SC2024语言导向语义通信,传输文本 + 扩散生成arXiv
Gen-SC Multi-task2024生成式多任务(重建 + 分割)arXiv

综述资源

中文综述推荐:移动通信 2025 第1期"6G 内生智能理论与关键技术"专题,涵盖 AI 赋能语义通信信道自适应技术、视频语义编码现状与展望等。

🗺️ 研究路径
路径 A:理论基础

从 Shannon 分离定理出发,理解 JSCC 的信息论动机。依次阅读 DeepJSCC → AIB-JSCC → SCAN,建立率失真理论和信息瓶颈视角。适合需要深入理论根基的研究者。

路径 B:生成式语义通信

直击当前最热方向。阅读 GESCO → CDDM → DiffJSCC → Gen-SC 系列,理解扩散模型如何在解码端消除信道噪声并生成高质量图像。适合快速跟进前沿。

路径 C:工业场景切入

面向电缆缺陷检测等实际应用。先了解 DeepJSCC 基础架构,再调研脉冲噪声/电磁干扰信道建模,最后探索如何保留缺陷纹理等任务关键特征。适合应用驱动型研究者。

路径 D:实时化与工程

关注扩散模型轻量化(Consistency Models、LCM、一步生成),以及 Transformer 架构的推理加速。从 DiffJSCC 出发,调研蒸馏/量化技术在语义通信中的应用。

📋 待研究专题
专题状态优先级
扩散模型在语义通信中的详细实现(GESCO / DiffJSCC 深读)待研究
电缆检测场景的特殊信道模型(脉冲噪声、部分放电干扰)待研究
Consistency Models / LCM 用于实时语义传输待研究
丢包/分组交换网络下的语义通信待研究
对抗性扰动下的语义通信鲁棒性待研究
语义通信安全性(窃听与隐私保护)待研究