ESC
输入关键词搜索文章
目录

谱图论:从图拉普拉斯到图信号处理

图论 · 谱图论 · 图信号处理
将图的代数结构与几何意义联系起来的数学框架
8核心概念
3例题
12关键公式
4配图

前置知识

  • 线性代数基础:矩阵特征值与特征向量、矩阵正定性。去哪里补:线性代数教材。
  • 图论基础:邻接矩阵、度矩阵、连通图的基本概念。
  • 离散信号处理基础:离散傅里叶变换(DFT)、Nyquist 采样定理。
Part 1 · 背景问题
为什么需要谱图论

传统 DSP 的频域分析范式

在传统离散信号处理中,Nyquist–Shannon 采样定理告诉我们:若信号带宽有限(band-limited),以不低于两倍带宽的频率采样即可完美恢复。这一结论依赖于一个关键结构——傅里叶基。给定均匀采样的离散信号序列 $\mathbf{x} = (x_0, x_1, \ldots, x_{N-1})$,其离散傅里叶变换(DFT)定义为:

$$\hat{x}_k = \frac{1}{\sqrt{N}} \sum_{n=0}^{N-1} x_n e^{-i 2\pi kn/N}, \quad k=0,1,\ldots,N-1$$

其逆变换将信号展开为频率基 $e^{i 2\pi kn/N}$ 的线性组合。频域分析的强大之处在于:频率 $k$ 编码了信号的平滑/振荡程度——低频率分量对应全局平滑,高频率分量对应快速变化。卷积定理 $\widehat{x \ast h} = \hat{x} \cdot \hat{h}$ 使得滤波操作变成频域中的逐点乘法。

图数据为何需要新框架

然而现实中的大量数据并非定义在均匀网格上。考虑以下场景:

  • 一个社交网络:节点 = 用户,边 = 关注关系,信号 = 用户的购买偏好评分
  • 一个脑网络:节点 = 脑区,边 = 白质纤维连接,信号 = fMRI 时间序列
  • 一个传感器网络:节点 = 传感器,边 = 空间邻近关系,信号 = 温度/湿度读数

这些数据的共同特征是:信号定义在图的顶点上,但图的结构是非规则、非均匀的。在这样的域上,经典的 DFT 没有定义,因为不存在等间隔的"时间轴"。

核心思路:用图拉普拉斯的特征基替代傅里叶基

谱图论提供了一种自然的推广思路。观察拉普拉斯算子在欧几里得空间中的作用:二阶导数算子 $\Delta = -\nabla^2$ 的特征函数正是傅里叶基 $e^{ikx}$,对应特征值 $\lambda_k = k^2$。这一定义完全可以迁移到图上——用图拉普拉斯矩阵 $L$ 替代连续拉普拉斯算子,其特征向量就扮演"图上的傅里叶基"角色:

$$\mathbf{L} \mathbf{u}_k = \lambda_k \mathbf{u}_k$$

低特征值(接近 0)的特征向量对应"全局平滑"的图信号模式——信号在相邻节点间变化平缓;高特征值的特征向量则对应高度振荡的"细节"模式。这与经典频域分析中低频/高频的对应完全一致,只是基底从正弦波变成了图的结构自适应基。

一句话理解:谱图论将图的结构信息编码为拉普拉斯矩阵的特征值,从而将经典频域分析迁移到非规则图结构上。
Part 2 · 核心定义
图拉普拉斯矩阵

三种基本形式

设无向图 $G = (V, E, \mathbf{W})$$N$ 个顶点,顶点集 $V = \{1, 2, \ldots, N\}$,加权邻接矩阵 $\mathbf{W} \in \mathbb{R}^{N\times N}$ 满足 $W_{ij} = W_{ji} \geq 0$,且 $W_{ij} > 0$ 当且仅当 $(i,j) \in E$。度矩阵 $\mathbf{D}$ 为对角矩阵,$D_{ii} = d_i = \sum_{j=1}^N W_{ij}$

组合拉普拉斯矩阵(Combinatorial Laplacian)

$$\mathbf{L} = \mathbf{D} - \mathbf{W}$$

其元素形式为:

$$L_{ij} = \begin{cases} d_i - W_{ii} & i=j \\ -W_{ij} & i\neq j, \; (i,j)\in E \\ 0 & \text{otherwise} \end{cases}$$

对于无自环的简单图,$W_{ii}=0$,故 $L_{ii}=d_i$

归一化拉普拉斯矩阵(Normalized Laplacian)

$$\mathbf{L}_{\text{sym}} = \mathbf{D}^{-1/2} \mathbf{L} \mathbf{D}^{-1/2} = \mathbf{I} - \mathbf{D}^{-1/2} \mathbf{W} \mathbf{D}^{-1/2}$$

此矩阵为对称半正定矩阵,其特征值严格落在 $[0, 2]$ 区间内。

随机游走拉普拉斯矩阵(Random Walk Laplacian)

$$\mathbf{L}_{\text{rw}} = \mathbf{D}^{-1} \mathbf{L} = \mathbf{I} - \mathbf{D}^{-1} \mathbf{W}$$

满足 $\mathbf{L}_{\text{rw}} \mathbf{1} = \mathbf{0}$,与随机游走转移矩阵 $\mathbf{P} = \mathbf{D}^{-1}\mathbf{W}$ 的特征值问题密切相关。随机游走拉普拉斯在社会学网络分析和 PageRank 中有重要应用。

三种矩阵之间存在明确关系:$\mathbf{L}_{\text{sym}} = \mathbf{D}^{1/2} \mathbf{L}_{\text{rw}} \mathbf{D}^{-1/2}$,它们的谱(特征值集合)紧密关联。

半正定性

对于任意向量 $\mathbf{x} \in \mathbb{R}^N$,组合拉普拉斯矩阵满足:

$$\mathbf{x}^\top \mathbf{L} \mathbf{x} = \frac{1}{2} \sum_{i,j=1}^N W_{ij} (x_i - x_j)^2 \tag{1}$$

式(1)是理解拉普拉斯矩阵性质的钥匙:它度量了信号在图边上的总变化量(variation)。由于 $W_{ij} \geq 0$$(x_i - x_j)^2 \geq 0$,对所有 $\mathbf{x}$ 都有 $\mathbf{x}^\top \mathbf{L} \mathbf{x} \geq 0$,故 $\mathbf{L}$ 半正定。

物理直觉:如果把图上的信号 $\mathbf{x}$ 看成温度分布,那么 $\mathbf{x}^\top \mathbf{L} \mathbf{x}$ 就是相邻节点之间的热传导总量——拉普拉斯矩阵度量了信号的"平滑程度"。

特征值的代数意义

$\mathbf{L}$ 的特征值按升序排列为:

$$0 = \lambda_1 \leq \lambda_2 \leq \cdots \leq \lambda_N$$

特征值与连通性的关系

  • $\lambda_1 = 0$ 对应的特征向量是全 1 向量 $\mathbf{1} = (1,1,\ldots,1)^\top$
  • 零特征值的代数重数等于图的连通分量个数
  • 图是连通的,当且仅当 $\lambda_2 > 0$

Fiedler 特征值(代数连通度)

第二小特征值 $\lambda_2$ 由 Fiedler 在 1973 年命名为 algebraic connectivity(代数连通度)。它提供了图的全局连通性的一种代数度量。直观上,$\lambda_2$ 越大,说明图的"连接越紧密",越难以被分割成两部分。反之,$\lambda_2$ 接近 0 表明图存在一个窄"瓶颈"(bottleneck),去掉少量边即可将图分裂。$\lambda_2$ 的对应特征向量 $\mathbf{u}_2$ 称为 Fiedler 向量,是谱聚类的核心工具。

Part 3 · 可视化理解
图拉普拉斯矩阵的直观理解

下面通过一个简单图例说明图拉普拉斯矩阵的结构与特征值含义:

{{< mermaid title="图拉普拉斯矩阵结构示意" >}}

flowchart LR

subgraph Graph["图 G = (V, E)"]

A((1)) ---|"W₁₂"| B((2))

A((1)) ---|"W₁₃"| C((3))

B((2)) ---|"W₂₃"| C((3))

B((2)) ---|"W₂₄"| D((4))

C((3)) ---|"W₃₄"| D((4))

end

subgraph Matrices["拉普拉斯矩阵"]

L1["L = D - W\n\nD = diag(d₁, d₂, d₃, d₄)\nd₁ = W₁₂ + W₁₃\n..."]

L2["谱 λ₁=0 ≤ λ₂ ≤ λ₃ ≤ λ₄\n\nλ₂ = 代数连通度\nu₂ = Fiedler 向量"]

end

Graph --> Matrices

{{< /mermaid >}}

左侧展示了一个四节点加权图的拓扑结构。每个节点的度 $d_i$ 是其所有邻边权重之和。对角矩阵 $\mathbf{D}$ 记录各节点的度,而 $\mathbf{L} = \mathbf{D} - \mathbf{W}$ 的特征值按右图顺序排列:零特征值对应常数信号,高特征值对应振荡模式。

例题 1:计算图拉普拉斯矩阵特征值

题目:考虑一个三节点完全图 $K_3$,每条边权重均为 1。求其组合拉普拉斯矩阵及其特征值。

  1. 写出邻接矩阵和度矩阵

    $$\mathbf{W} = \begin{pmatrix} 0 & 1 & 1 \\ 1 & 0 & 1 \\ 1 & 1 & 0 \end{pmatrix}, \quad \mathbf{D} = \begin{pmatrix} 2 & 0 & 0 \\ 0 & 2 & 0 \\ 0 & 0 & 2 \end{pmatrix}$$
  2. 计算拉普拉斯矩阵

    $$\mathbf{L} = \mathbf{D} - \mathbf{W} = \begin{pmatrix} 2 & -1 & -1 \\ -1 & 2 & -1 \\ -1 & -1 & 2 \end{pmatrix}$$
  3. 求特征值:观察 $\mathbf{L}\mathbf{1} = \mathbf{0}$,故 $\lambda_1 = 0$$\mathbf{u}_1 = (1,1,1)^\top$。其余特征值为 $3$(重数 2),对应与 $\mathbf{1}$ 正交的特征向量。

答案:$\lambda_1 = 0$$\lambda_2 = \lambda_3 = 3$。这表明完全图连通性极强——任意切割都需要跨过大量边。

易错点:不要混淆归一化拉普拉斯与组合拉普拉斯。归一化拉普拉斯 $\mathbf{L}_{\text{sym}}$ 的特征值范围是 $[0,2]$,而组合拉普拉斯可以达到更大的值。

路径图与完全图的对比

考虑两个极端图例以建立直观:

  • 路径图 $P_N$$N$ 个顶点排成一条直线,仅相邻顶点相连(边权均为 1)。其拉普拉斯特征值为 $\lambda_k = 2 - 2\cos\frac{\pi(k-1)}{N}$$k=1,\ldots,N$。注意 $\lambda_2 = 2 - 2\cos\frac{\pi}{N} \approx \frac{\pi^2}{N^2}$(当 $N$ 较大时),随 $N$ 增长趋近于 0——这反映了路径图两端之间存在大量"瓶颈",整体连通脆弱。
  • 完全图 $K_N$:所有顶点两两相连,边权均为 1。度矩阵 $D_{ii}=N-1$,拉普拉斯矩阵 $\mathbf{L} = (N-1)\mathbf{I} - \mathbf{J}$$\mathbf{J}$ 为全 1 矩阵)。其非零特征值为 $N$,重数 $N-1$。故 $\lambda_2 = N$,非常大,说明完全图不可能被轻易切割。
Part 4 · 核心定理
Cheeger 不等式:从几何到代数的桥梁

Cheeger 不等式建立了图的最优切割难度(组合量)与图的代数连通度(代数量)之间的双向不等式关系。

符号准备与 Cheeger 常数

设图 $G = (V, E)$ 的顶点集合被划分为两个非空子集 $S$$T = V \setminus S$。定义切割(cut)为集合 $\delta(S) = \{ (i,j) \in E : i\in S, j\in T \}$,其容量(volume)之和为 $\text{vol}(S) = \sum_{i\in S} d_i$

Cheeger 常数

$$h(G) = \min_{S\subseteq V, 0<\text{vol}(S)\leq\frac{\text{vol}(V)}{2}} \frac{|\delta(S)|}{\text{vol}(S)}\tag{2}$$

其中 $|\delta(S)|$ 为切割涉及的边数。Cheeger 常数度量了图的"最窄瓶颈"——最小的"边数/内部度数"比值。高 Cheeger 常数意味着任何合理的切割都必须涉及足够多的边,即图难以被切开;低 Cheeger 常数意味着存在一个相对较小的切割。

经典 Cheeger 不等式

对于任意无向图 $G$

$$\frac{h(G)}{2} \leq \lambda_2 \leq h(G)\tag{3}$$

其中 $\lambda_2$ 是组合拉普拉斯矩阵的第二小特征值(代数连通度)。

统一解释:代数连通度越大,图越难被"切开"

将两个不等式合并来看:

$$\frac{h(G)}{2} \leq \lambda_2 \leq h(G) \quad \Longrightarrow \quad h(G) \approx 2\lambda_2$$

Cheeger 常数和代数连通度在常数因子(2 倍)范围内相互控制。具体含义:

  • $\lambda_2$ 大,则 $h(G) \geq \lambda_2$ 大,切割任何合理的子集都需要大量边,图连通紧密
  • $\lambda_2$ 小,则 $h(G) \leq 2\lambda_2$ 小,存在一个相对小的切割,图存在明显分隔

这一结果给谱方法(spectral methods)提供了理论保证:在不知道最优切割的情况下,仅凭 $\lambda_2$ 和 Fiedler 向量就可以得到一个"不算太差"的切割——切割质量至少在两倍最优范围内。谱聚类(spectral clustering)算法正是基于这一原理设计的。

{{< mermaid title="Cheeger 不等式几何解释" >}}

graph TD

subgraph Good["λ₂ 大 → h(G) 大 → 图连通紧密"]

G1["高连通图"] --> E1["λ₂ = 5.2"]

E1 --> C1["任意切割都需大量边"]

C1 --> H1["h(G) ≈ 2λ₂"]

end

subgraph Bad["λ₂ 小 → h(G) 小 → 图存在明显分隔"]

G2["带瓶颈的图"] --> E2["λ₂ = 0.03"]

E2 --> C2["存在小切割"]

C2 --> H2["h(G) ≈ 2λ₂"]

end

style Good fill:#dcfce7

style Bad fill:#fee2e2

{{< /mermaid >}}

上图中展示了两种极端情况:左侧图连通紧密,其代数连通度大,切割任何子集都需要跨越较多边;右侧图存在明显的"瓶颈"区域,其代数连通度接近零,存在相对容易的切割。

Part 5 · 频域框架
图上的傅里叶变换

拉普拉斯特征向量作为图上的"傅里叶基"

$\mathbf{L}$ 的特征值互异(或按重数选取正交基),其特征向量矩阵 $\mathbf{U} = [\mathbf{u}_1, \mathbf{u}_2, \ldots, \mathbf{u}_N] \in \mathbb{R}^{N\times N}$ 满足 $\mathbf{U}^\top \mathbf{U} = \mathbf{I}_N$——即特征向量构成标准正交基。这与 DFT 矩阵的酉性完全对应。

图拉普拉斯 $\mathbf{L}$ 对应的连续拉普拉斯算子 $\Delta = -\nabla^2$ 的特征函数是复指数 $e^{ikx}$,而后者恰好是单位圆(周期边界)上图的拉普拉斯算子的特征函数。因此,图拉普拉斯特征向量的角色就是"结构自适应正交基",其选择完全由图的结构决定,而非预先固定。

图傅里叶变换(Graph Fourier Transform, GFT)

图傅里叶变换

给定图信号 $\mathbf{x} \in \mathbb{R}^N$(即定义在图顶点上的标量场),其图傅里叶变换定义为:

$$\hat{x}_k = \langle \mathbf{x}, \mathbf{u}_k \rangle = \mathbf{u}_k^\top \mathbf{x} = \sum_{i=1}^N u_{k,i} x_i, \quad k=1,\ldots,N\tag{4}$$

逆变换为:

$$x_i = \sum_{k=1}^N \hat{x}_k u_{k,i}, \quad i=1,\ldots,N\tag{5}$$

式(4)中 $\hat{x}_k$ 是信号 $\mathbf{x}$ 在特征向量 $\mathbf{u}_k$ 上的投影系数,度量了信号中"频率为 $\lambda_k$"的分量强度。

频率的含义

与经典 DFT 类似,图拉普拉斯特征值的排序定义了频率层级:

  • $\lambda_1 = 0$$\mathbf{u}_1 = \mathbf{1}/\sqrt{N}$,对应的图傅里叶系数 $\hat{x}_1 = \mathbf{1}^\top \mathbf{x}/\sqrt{N}$ 恰好是信号均值(直流分量)
  • $\lambda_2$ 低 → 低频 → 全局平滑(相邻节点值相近)
  • $\lambda_k$ 高 → 高频 → 局部剧烈变化(相邻节点值差异大)

可以形式化地定义图信号的总变差(Total Variation, TV):

$$\TV(\mathbf{x}) = \mathbf{x}^\top \mathbf{L} \mathbf{x} = \frac{1}{2}\sum_{i,j} W_{ij}(x_i - x_j)^2 = \sum_{k=1}^N \lambda_k |\hat{x}_k|^2\tag{6}$$

式(6)揭示了 TV 与 GFT 系数之间的对角关系:每个频率分量对总变差的贡献由其对应特征值加权。因此,低通图滤波器(smoothing filter)抑制高频分量,即降低 $\TV(\mathbf{x})$

一个具体例子:完全图上的 GFT

在完全图 $K_N$ 中,$\mathbf{L} = N\mathbf{I} - \mathbf{J}$。其特征值为 $\lambda_1 = 0$(对应 $\mathbf{u}_1 = \mathbf{1}/\sqrt{N}$),$\lambda_k = N$$k=2,\ldots,N$,相互正交的特征向量张成与 $\mathbf{1}$ 正交的子空间)。此时 GFT 退化为:

$$\hat{x}_1 = \frac{1}{\sqrt{N}}\sum_i x_i \quad \text{(均值)}$$
$$\hat{x}_k = \mathbf{u}_k^\top \mathbf{x} \quad \text{(去均值后的投影)}, \quad k=2,\ldots,N$$

完全图上的高频分量并不对应任何几何意义——图上任意两点都直接相连,没有"空间"可以振荡。但在真实稀疏图(如传感器网络、脑网络)中,高频特征向量对应图上节点的空间局部振荡模式,具有明确的物理/结构意义。

Part 6 · 滤波器设计
图滤波器

谱域滤波器设计的基本思想

在经典 DSP 中,线性时不变滤波器通过卷积实现,其频域表示为 $\hat{y}_k = \hat{h}_k \cdot \hat{x}_k$(逐点乘法)。图信号处理中,线性图滤波器定义为信号与图拉普拉斯特征基上的系数变换:

$$\hat{y}_k = h(\lambda_k) \hat{x}_k, \quad k=1,\ldots,N\tag{7}$$

其中 $h(\lambda): [0, \lambda_{\max}] \to \mathbb{R}$ 称为滤波器的 频率响应,是定义在拉普拉斯谱上的函数。逆变换给出空域形式:

$$\mathbf{y} = \mathbf{U} \operatorname{diag}(h(\lambda_1), \ldots, h(\lambda_N)) \mathbf{U}^\top \mathbf{x} = h(\mathbf{L}) \mathbf{x}$$

其中 $h(\mathbf{L}) = \mathbf{U} \operatorname{diag}(h(\lambda_k)) \mathbf{U}^\top$ 是拉普拉斯矩阵的多项式(更一般地,矩阵函数)。

滤波器类型

类型条件效果应用场景
低通(low-pass)$h(\lambda) \approx 1$$\lambda \leq \lambda_c$$h(\lambda) \approx 0$$\lambda > \lambda_c$抑制高频分量,平滑信号去噪、插值、半监督学习
高通(high-pass)$h(\lambda) \approx 0$$\lambda \leq \lambda_c$$h(\lambda) \approx 1$$\lambda > \lambda_c$提取局部变化/异常异常检测、边缘提取
带通(band-pass)$h(\lambda) \approx 1$ 在某个 $\lambda$ 区间内提取特定尺度振荡多尺度分析、社区检测

ChebNet 的多项式近似

Defferrard et al.(NeurIPS 2016)提出的 ChebNet 通过截断 Chebyshev 多项式近似克服了这一计算瓶颈。核心方法是将频率响应 $h(\lambda)$$K$ 阶 Chebyshev 多项式展开:

$$h(\lambda) \approx \sum_{k=0}^{K-1} \beta_k T_k(\tilde{\lambda})\tag{8}$$

其中 $\tilde{\lambda} = \frac{2}{\lambda_{\max}}\lambda - 1 \in [-1,1]$ 是重新缩放的特征值(确保在 Chebyshev 多项式的定义域内),$T_k$ 为 Chebyshev 多项式,满足递归关系:

$$T_0(\tilde{\lambda}) = 1,\quad T_1(\tilde{\lambda}) = \tilde{\lambda},\quad T_{k+1}(\tilde{\lambda}) = 2\tilde{\lambda}T_k(\tilde{\lambda}) - T_{k-1}(\tilde{\lambda})$$

截断后:

$$h(\mathbf{L}) \approx \sum_{k=0}^{K-1} \beta_k T_k(\tilde{\mathbf{L}}), \quad \tilde{\mathbf{L}} = \frac{2}{\lambda_{\max}}\mathbf{L} - \mathbf{I}$$

关键优势:$T_k(\tilde{\mathbf{L}})$ 可以通过递推关系高效计算,每次矩阵-向量乘法只需 O(|E|)(稀疏矩阵乘法),总复杂度 O(K|E|)。参数 $\beta_k$ 通过学习得到,而非手动设计频率响应。

图滤波器频率响应示意JSXGraph
图滤波器频率响应示意

上图展示了三种基本图滤波器的频率响应曲线。蓝色曲线表示低通滤波器,保留低频分量(小的 $\lambda_k$)而抑制高频分量;红色曲线表示高通滤波器,提取局部剧烈变化;绿色曲线表示带通滤波器,仅保留某一频带内的信号成分。

Part 7 · 应用
图信号的采样与恢复

Nyquist-Shannon 采样定理的图上推广

经典 Nyquist-Shannon 定理的图版本需要回答以下问题:给定图上部分节点上的信号值,能否唯一恢复完整的图信号?答案取决于信号的频率支撑。

设图信号 $\mathbf{x}$ 的图傅里叶变换系数满足 $\hat{x}_k = 0$ 对所有 $\lambda_k > \lambda_c$ 成立,即 $\mathbf{x}$$\lambda_c$-bandlimited。设采样集 $M \subseteq V$,采样后的降采样信号记为 $\mathbf{x}_M$(仅保留 $M$ 上节点的值)。恢复问题:是否存在唯一 $\mathbf{x}$ 使 $\mathbf{x}_M$ 与观察值一致?

图采样定理的关键结果

Ganis et al.(2015)和 Chen et al.(2015)独立给出了图上的采样定理。对于无向连通图上的 band-limited 信号,以下条件等价:

  1. 信号 $\mathbf{x}$$\lambda_c$-bandlimited
  2. $\mathbf{x}$ 可以表示为拉普拉斯逆矩阵 $(\mathbf{L} + \epsilon\mathbf{I})^{-1}$ 与某向量的乘积(低秩表示)
  3. 在足够稠密的采样集 $M$ 上,仅通过插值即可唯一恢复 $\mathbf{x}$

采样集 $M$ 的充分条件与其 图频率响应支撑 有关。Narang et al.(2013)证明:若采样集的 cardinality 满足 $|M| \geq K$(其中 $K$ 为 bandlimit),且采样矩阵满足一定的 RIP(Restricted Isometry Property)类条件,则存在唯一的完美恢复。

采样定理的图直觉

从 Cheeger 不等式的角度理解:图的代数连通度 $\lambda_2$ 越大,图的"全局耦合"越强,意味着低频信号在不同节点间的相关性越高,从而少量采样点即可蕴含足够的全局信息。反之,路径图这样 $\lambda_2$ 极小的图,节点间相关性弱,需要大量采样才能恢复信号。

与经典的对应关系

经典 DSP图信号处理
均匀采样网格图的节点子集 $M$
Nyquist 频率 $\frac{1}{2\Delta}$图 bandlimit $\lambda_c$
sinc 插值核图拉普拉斯核 $(\mathbf{L} + \epsilon\mathbf{I})^{-1}$
欠采样产生混叠图上的 aliasing(混叠)体现为高频分量伪装成低频分量
Part 8 · 例题
图滤波器设计实例

例题 2:设计图滤波器

题目:给定一个正则图(度 $d=4$),设计一个低通图滤波器,使频率响应满足:$h(0) = 1$$h(\lambda_{\max}) = 0$,且在 $\lambda \in [0, d]$ 区间内单调递减。使用一阶 Chebyshev 多项式近似。

  1. 写出滤波器的理想频率响应:使用指数低通形式
    $$h(\lambda) = e^{-\alpha \lambda}$$

    其中 $\alpha > 0$ 控制截止宽度。

  2. 确定归一化拉普拉斯特征值范围:对于正则图 $d$,组合拉普拉斯 $\mathbf{L}$ 的最大特征值 $\lambda_{\max} \leq 2d$。归一化拉普拉斯 $\mathbf{L}_{\text{sym}}$ 的特征值范围为 $[0, 2]$
  3. 用一阶多项式近似$K=1$ 时,Chebyshev 近似退化为
    $$h(\mathbf{L}_{\text{sym}}) \approx \beta_0 \mathbf{I} + \beta_1 \tilde{\mathbf{L}}_{\text{sym}}$$

    其中 $\tilde{\mathbf{L}}_{\text{sym}} = \frac{2}{2}\mathbf{L}_{\text{sym}} - \mathbf{I} = \mathbf{L}_{\text{sym}} - \mathbf{I}$

  4. 确定系数:要求 $h(0) = 1$$h(2) = 0$,解方程组
    $$\beta_0 = 1, \quad \beta_0 + \beta_1 = 0 \Rightarrow \beta_1 = -1$$

    $h(\mathbf{L}_{\text{sym}}) \approx \mathbf{I} - \mathbf{L}_{\text{sym}}$

答案:空域实现为 $\mathbf{y} = (\mathbf{I} - \mathbf{L}_{\text{sym}})\mathbf{x}$,即 $\mathbf{y} = \mathbf{D}^{-1/2}\mathbf{W}\mathbf{D}^{-1/2}\mathbf{x}$。这恰好是图卷积网络(GCN)的一层传播规则!

关键洞察:GCN 的传播矩阵 $\tilde{\mathbf{D}}^{-\frac{1}{2}}\tilde{\mathbf{A}}\tilde{\mathbf{D}}^{-\frac{1}{2}}$ 本质上是一个低通图滤波器的离散实现。

例题 3:分析代数连通度与图分割

题目:考虑一个 5 节点链式图(路径图 $P_5$),使用 Cheeger 不等式估计最优切割的 Cheeger 常数。

  1. 计算路径图 $P_5$ 的拉普拉斯特征值:路径图的特征值为
    $$\lambda_k = 2 - 2\cos\frac{\pi(k-1)}{5}, \quad k=1,\ldots,5$$

    $\lambda_2 = 2 - 2\cos\frac{\pi}{5} \approx 2 - 2 \times 0.809 = 0.382$

  2. 应用 Cheeger 不等式
    $$\frac{h(G)}{2} \leq \lambda_2 \leq h(G)$$
    $$\Rightarrow \frac{0.382}{2} \leq h(G) \leq 0.382$$

    $$\Rightarrow 0.191 \leq h(G) \leq 0.382$$

答案:路径图的最优 Cheeger 常数在 $[0.191, 0.382]$ 之间。实际上,路径图的最优切割是将端点与相邻节点分离,此时 $h(G) = \frac{1}{4} = 0.25$,符合上述界。

Part 9 · 应用前景
应用场景

图神经网络的谱解释

图神经网络(GNN)近年来在图表示学习中取得了突破性进展,而谱图论为其提供了坚实的理论基础。

GCN(Kipf & Welling, ICLR 2017)的一层前向传播为:

$$\mathbf{H}^{(l+1)} = \sigma\big( \tilde{\mathbf{D}}^{-\frac{1}{2}} \tilde{\mathbf{A}} \tilde{\mathbf{D}}^{-\frac{1}{2}} \mathbf{H}^{(l)} \mathbf{W}^{(l)} \big)$$

其中 $\tilde{\mathbf{A}} = \mathbf{A} + \mathbf{I}$ 为加自环的邻接矩阵。该传播规则实际上是归一化拉普拉斯 $\mathbf{L}_{\text{sym}}$ 的一阶多项式近似($K=1$ 的 ChebNet 截断):

$$\mathbf{L}_{\text{sym}} \approx \mathbf{I} - \tilde{\mathbf{D}}^{-\frac{1}{2}} \tilde{\mathbf{A}} \tilde{\mathbf{D}}^{-\frac{1}{2}} = \mathbf{I} - \tilde{\mathbf{D}}^{-\frac{1}{2}} (\mathbf{A}+\mathbf{I}) \tilde{\mathbf{D}}^{-\frac{1}{2}}$$

因此,GCN 的每一层就是一个在归一化拉普拉斯谱域上的低通图滤波器。层数增多相当于使用更宽的多项式滤波器逼近,从而能够聚合更广邻域的信息。这解释了 GCN 的"过度平滑"(oversmoothing)现象:堆叠过多层后,低通滤波器反复抑制高频分量,使所有节点嵌入收敛到相似的表示——这正是低通滤波器的固有行为。

传感器网络中的分布式信号处理

在无线传感器网络中,每个传感器仅能与邻居通信,要求分布式算法。Chebyshev 多项式近似的关键特性是 局域性$T_k(\tilde{\mathbf{L}})\mathbf{x}$ 的第 $i$ 个分量仅依赖于节点 $i$$K$-跳邻域内的信号值。这意味着分布式实现中,每个节点只需与有限跳邻居交换信息即可完成滤波。

Shuman et al.(2018)在这一方向上做出了系统性贡献,将分布式图信号处理的计算、通信和存储开销量化为 O(K|E|)、O(K|E|) 和 O(N),与图的规模线性相关。

脑网络分析

功能性磁共振成像(fMRI)数据本质上是大脑区域间的时间序列,每个区域对应图的节点,白质纤维连接定义了边。利用 GSP 工具,研究者可以:

  • 对 fMRI 信号做图频域分析,识别功能性连通网络(低频主导)
  • 将健康脑网络与病理脑网络(如阿尔茨海默症)对比,发现 $\lambda_2$ 等谱指标在两组间存在显著差异
  • 在脑网络上进行 band-pass 滤波(0.01–0.1 Hz)提取低频血氧信号,这正是神经科学中默认模式网络(Default Mode Network)分析的数学实现

核心要点回顾

  • 图拉普拉斯$\mathbf{L} = \mathbf{D} - \mathbf{W}$,半正定矩阵,度量信号在图边上的总变差
  • 代数连通度$\lambda_2$ 是图的连通性度量,$\lambda_2 \to 0$ 表示存在瓶颈
  • Cheeger 不等式$\frac{h(G)}{2} \leq \lambda_2 \leq h(G)$,连接几何切割与代数连通度
  • 图傅里叶变换:在拉普拉斯特征基上展开信号,低特征值 = 低频 = 全局平滑
  • 图滤波器:谱域逐点乘法 $h(\lambda_k)$,空域多项式 $h(\mathbf{L})$ 实现
  • ChebNet:通过 Chebyshev 多项式实现高效图卷积,复杂度 O(K|E|)