特征值迭代方法
模块导航
- 第一组:问题背景与基本定义 —— Part 0–2
- 第二组:乘幂法、反幂法与例题 —— Part 3–5
- 第三组:课程收束与复习 —— Part 6 + 速查
这一页讨论的是数值分析里一个非常典型的转折:在线性代数中,我们知道特征值满足 $Ax=\lambda x$,也知道它来自特征多项式 $|A-\lambda I|=0$;但当矩阵阶数很大时,直接解这个多项式既昂贵又不稳定。因此数值分析转而问:能不能不求“全部精确特征值”,而是先迭代逼近最重要的几个?
课件给出的答案是:乘幂法求按模最大特征值,反幂法求按模最小特征值。它们本质上都不是“解方程”,而是反复把向量丢进矩阵的作用里,看哪个方向会被保留下来。
前置知识回顾
- 特征值与特征向量定义:若 $Ax=\lambda x$ 且 $x\ne 0$,则 $\lambda$ 是特征值,$x$ 是对应特征向量。
- 向量范数:本章课件采用 $\infty$-范数做规范化,即 $\|x\|_\infty=\max_i |x_i|$。
- 线性无关特征向量:乘幂法的理论分析依赖矩阵有一组线性无关特征向量。
- LU 分解:反幂法每一步都要解线性方程组,因此会直接调用前面章节的 LU 分解思想。可回看 线性方程组与矩阵数值计算。
在理论课里,我们常通过特征多项式寻找全部特征值。但当矩阵很大时,这个路线会变得不现实:行列式计算开销高,求高次多项式根也不稳定。数值分析的策略因此转变为:
- 先只求按模最大特征值,因为它往往主导长期行为;
- 再进一步通过逆矩阵视角求按模最小特征值;
- 如果需要,再把这些迭代结果拼成更复杂的特征值算法链。
所以这章最重要的不是“多了两个公式”,而是思维方式的变化:从一次性求解,切换到逐步逼近。
乘幂法的适用前提
设矩阵 $A$ 的特征值按模排序为
并且存在一组线性无关特征向量 $u_1,\dots,u_n$。若初始向量在 $u_1$ 方向上有非零分量,则迭代后会逐步对齐到主特征向量方向。
规范化(Normalization)
直接迭代 $x_{k+1}=Ax_k$ 会遇到两种数值问题:
- 若 $|\lambda_1|>1$,主方向分量会越来越大,可能上溢;
- 若 $|\lambda_1|<1$,分量会越来越小,可能下溢。
因此每一步都要做规范化,把向量缩放回适中量级。
反幂法
若 $A$ 非奇异,且 $Ax=\lambda x$,则
于是 $A$ 的按模最小特征值,会转化成 $A^{-1}$ 的按模最大特征值问题。反幂法正是基于这一步变换。
乘幂法的主方向保留机制
把初始向量写成特征向量展开:
则反复乘以 $A$ 后有
由于对 $i\ge 2$ 有 $|\lambda_i/\lambda_1|<1$,故当 $k\to\infty$ 时,后面的分量逐步衰减,向量方向趋近于 $u_1$。
规范化乘幂法格式
课件采用的规范化方式为
并用
作为按模最大特征值的近似。若
就停止迭代。
反幂法为什么不显式求逆
虽然理论上是对 $A^{-1}$ 做乘幂法,但数值实现并不直接求逆,而是每一步解
若先做
则每一步只需解两个三角方程:
这样既更稳定,也更高效。随后再取
作为按模最小特征值的近似。
| 方法 | 目标 | 每步核心操作 | 关键条件 | 数值注意点 |
|---|---|---|---|---|
| 乘幂法 | 按模最大特征值 | 矩阵乘向量 | $|\lambda_1|>|\lambda_2|$ 且初值含主方向分量 | 必须规范化,防止上溢/下溢 |
| 反幂法 | 按模最小特征值 | 解线性方程组 $Ax=z$ | $A$ 非奇异 | 不显式求逆,宜先做 LU 分解 |
例题 1 · 规范化乘幂法的迭代流程
题目:给定一个 3 阶矩阵、初始向量 $x_0=(0,0,1)^T$、误差限 $10^{-3}$,说明如何按课件流程迭代逼近主特征值。
- 第一步:取 $z_0=x_0/\|x_0\|_\infty=x_0$。
- 第二步:计算 $x_1=Az_0$,再取 $\lambda^{(1)}\approx \|x_1\|_\infty$。
- 第三步:规范化得到 $z_1=x_1/\|x_1\|_\infty$,再算 $x_2=Az_1$。
- 第四步:持续比较相邻两次特征值近似,直到差值小于阈值 $\varepsilon$。
答案:这一流程展示的不是单纯算表,而是“矩阵反复强化主方向 + 每步拉回量级”的机制。最终得到的特征向量近似,本质上是规范化后的主方向。
例题 2 · 为什么初值不能刚好避开主特征方向
题目:说明为什么若初始向量在主特征向量方向上的系数 $a_1=0$,乘幂法可能不能收敛到按模最大特征值。
- 第一步:写出 $x_0=a_1u_1+\cdots+a_nu_n$ 的展开。
- 第二步:若 $a_1=0$,则迭代过程中不会凭空“生成” $u_1$ 分量。
- 第三步:因此向量只会在其余特征方向子空间里演化,无法对齐到 $u_1$。
答案:乘幂法的成功不仅依赖特征值模分离,也依赖初值没有把主方向完全排除掉。
后续用途 / 连接
这一章把线性代数中的“特征值定义”推进到了“如何数值上逼近特征信息”。乘幂法体现了矩阵乘向量的低成本迭代思想;反幂法则把特征值问题重新接回“解线性方程组”与 LU 分解。后续更高级的特征值算法,很多都可以看成是在这两条思路之上继续发展出来的。
复习速查
- 乘幂法目标:求按模最大特征值及对应特征向量。
- 核心条件:$|\lambda_1|>|\lambda_2|$,且初值含主特征向量分量。
- 规范化格式:$z_k=x_k/\|x_k\|_\infty$,$x_{k+1}=Az_k$。
- 近似特征值:可用 $\|x_{k+1}\|_\infty$ 近似按模最大特征值。
- 反幂法目标:求按模最小特征值。
- 关键转化:$A^{-1}x=\lambda^{-1}x$。
- 数值实现:不显式求逆,而是先做 LU 分解,再重复解三角方程组。
参考来源
- 电子科技大学数学科学学院数值分析课程组:《数值分析》Chap22 PDF 讲义(主参考来源)
- 本章结构与公式解释严格以本地 PDF 为主,仅对文本抽取混乱处做上下文整理,不使用网页材料覆盖课程脉络。