ESC
输入关键词搜索文章
目录

特征值迭代方法

Chap 22 · 数值分析
从乘幂法到反幂法——大矩阵特征值怎样被迭代逼近
5核心主题
2迭代方法
7关键公式
2典型例题

模块导航

  • 第一组:问题背景与基本定义 —— Part 0–2
  • 第二组:乘幂法、反幂法与例题 —— Part 3–5
  • 第三组:课程收束与复习 —— Part 6 + 速查
Part 0 · 学习目标
为什么特征值问题不能只靠特征多项式硬算

这一页讨论的是数值分析里一个非常典型的转折:在线性代数中,我们知道特征值满足 $Ax=\lambda x$,也知道它来自特征多项式 $|A-\lambda I|=0$;但当矩阵阶数很大时,直接解这个多项式既昂贵又不稳定。因此数值分析转而问:能不能不求“全部精确特征值”,而是先迭代逼近最重要的几个?

课件给出的答案是:乘幂法求按模最大特征值,反幂法求按模最小特征值。它们本质上都不是“解方程”,而是反复把向量丢进矩阵的作用里,看哪个方向会被保留下来

前置知识回顾

  • 特征值与特征向量定义:若 $Ax=\lambda x$$x\ne 0$,则 $\lambda$ 是特征值,$x$ 是对应特征向量。
  • 向量范数:本章课件采用 $\infty$-范数做规范化,即 $\|x\|_\infty=\max_i |x_i|$
  • 线性无关特征向量:乘幂法的理论分析依赖矩阵有一组线性无关特征向量。
  • LU 分解:反幂法每一步都要解线性方程组,因此会直接调用前面章节的 LU 分解思想。可回看 线性方程组与矩阵数值计算
Part 1 · 背景问题
从“求所有特征值”退一步,先抓住最主导的那个方向

在理论课里,我们常通过特征多项式寻找全部特征值。但当矩阵很大时,这个路线会变得不现实:行列式计算开销高,求高次多项式根也不稳定。数值分析的策略因此转变为:

  1. 先只求按模最大特征值,因为它往往主导长期行为;
  2. 再进一步通过逆矩阵视角求按模最小特征值
  3. 如果需要,再把这些迭代结果拼成更复杂的特征值算法链。

所以这章最重要的不是“多了两个公式”,而是思维方式的变化:从一次性求解,切换到逐步逼近。

几何直觉:乘幂法像把一个向量不断丢进矩阵产生的“流场”中,最后其余方向被相对压制,只剩主特征方向最显眼。
Part 2 · 概念定义
乘幂法、规范化与反幂法的基本对象

乘幂法的适用前提

设矩阵 $A$ 的特征值按模排序为

$$|\lambda_1|>|\lambda_2|\ge \cdots \ge |\lambda_n|$$

并且存在一组线性无关特征向量 $u_1,\dots,u_n$。若初始向量在 $u_1$ 方向上有非零分量,则迭代后会逐步对齐到主特征向量方向。

规范化(Normalization)

直接迭代 $x_{k+1}=Ax_k$ 会遇到两种数值问题:

  • $|\lambda_1|>1$,主方向分量会越来越大,可能上溢;
  • $|\lambda_1|<1$,分量会越来越小,可能下溢。

因此每一步都要做规范化,把向量缩放回适中量级。

反幂法

$A$ 非奇异,且 $Ax=\lambda x$,则

$$A^{-1}x=\lambda^{-1}x$$

于是 $A$ 的按模最小特征值,会转化成 $A^{-1}$ 的按模最大特征值问题。反幂法正是基于这一步变换。

Part 3 · 推导
为什么乘幂法会收敛,反幂法为什么要靠解方程而不是显式求逆

乘幂法的主方向保留机制

把初始向量写成特征向量展开:

$$x_0=a_1u_1+a_2u_2+\cdots+a_nu_n,\qquad a_1\ne 0$$

则反复乘以 $A$ 后有

$$A^kx_0=\lambda_1^k\left(a_1u_1+a_2\left(\frac{\lambda_2}{\lambda_1}\right)^k u_2+\cdots+a_n\left(\frac{\lambda_n}{\lambda_1}\right)^k u_n\right)$$

由于对 $i\ge 2$$|\lambda_i/\lambda_1|<1$,故当 $k\to\infty$ 时,后面的分量逐步衰减,向量方向趋近于 $u_1$

规范化乘幂法格式

课件采用的规范化方式为

$$z_k=\frac{x_k}{\|x_k\|_\infty},\qquad x_{k+1}=Az_k$$

并用

$$\lambda^{(k+1)}\approx \|x_{k+1}\|_\infty$$

作为按模最大特征值的近似。若

$$|\lambda^{(k+1)}-\lambda^{(k)}|<\varepsilon$$

就停止迭代。

反幂法为什么不显式求逆

虽然理论上是对 $A^{-1}$ 做乘幂法,但数值实现并不直接求逆,而是每一步解

$$Ax_{k+1}=z_k$$

若先做

$$A=LU$$

则每一步只需解两个三角方程:

$$Lw_k=z_k,\qquad Ux_{k+1}=w_k$$

这样既更稳定,也更高效。随后再取

$$a^{(k+1)}=\|x_{k+1}\|_\infty,\qquad \lambda^{(k+1)}\approx \frac{1}{a^{(k+1)}}$$

作为按模最小特征值的近似。

Part 4 · 性质
乘幂法与反幂法的比较
方法目标每步核心操作关键条件数值注意点
乘幂法按模最大特征值矩阵乘向量$|\lambda_1|>|\lambda_2|$ 且初值含主方向分量必须规范化,防止上溢/下溢
反幂法按模最小特征值解线性方程组 $Ax=z$$A$ 非奇异不显式求逆,宜先做 LU 分解
Part 5 · 例题与实验
把抽象收敛条件落到具体迭代里

例题 1 · 规范化乘幂法的迭代流程

题目:给定一个 3 阶矩阵、初始向量 $x_0=(0,0,1)^T$、误差限 $10^{-3}$,说明如何按课件流程迭代逼近主特征值。

  1. 第一步:取 $z_0=x_0/\|x_0\|_\infty=x_0$
  2. 第二步:计算 $x_1=Az_0$,再取 $\lambda^{(1)}\approx \|x_1\|_\infty$
  3. 第三步:规范化得到 $z_1=x_1/\|x_1\|_\infty$,再算 $x_2=Az_1$
  4. 第四步:持续比较相邻两次特征值近似,直到差值小于阈值 $\varepsilon$

答案:这一流程展示的不是单纯算表,而是“矩阵反复强化主方向 + 每步拉回量级”的机制。最终得到的特征向量近似,本质上是规范化后的主方向。

易错点:停止准则比较的是近似特征值差值,不是简单看向量某一分量是否“不再变化”。

例题 2 · 为什么初值不能刚好避开主特征方向

题目:说明为什么若初始向量在主特征向量方向上的系数 $a_1=0$,乘幂法可能不能收敛到按模最大特征值。

  1. 第一步:写出 $x_0=a_1u_1+\cdots+a_nu_n$ 的展开。
  2. 第二步:若 $a_1=0$,则迭代过程中不会凭空“生成” $u_1$ 分量。
  3. 第三步:因此向量只会在其余特征方向子空间里演化,无法对齐到 $u_1$

答案:乘幂法的成功不仅依赖特征值模分离,也依赖初值没有把主方向完全排除掉。

易错点:很多人只记住了 $|\lambda_1|>|\lambda_2|$,却忽略了初值方向条件,这会误以为“随便给一个向量都一定行”。
Part 6 · 后续章节
特征值迭代如何回接线性代数与数值线性代数

后续用途 / 连接

这一章把线性代数中的“特征值定义”推进到了“如何数值上逼近特征信息”。乘幂法体现了矩阵乘向量的低成本迭代思想;反幂法则把特征值问题重新接回“解线性方程组”与 LU 分解。后续更高级的特征值算法,很多都可以看成是在这两条思路之上继续发展出来的。

复习速查

  • 乘幂法目标:求按模最大特征值及对应特征向量。
  • 核心条件$|\lambda_1|>|\lambda_2|$,且初值含主特征向量分量。
  • 规范化格式$z_k=x_k/\|x_k\|_\infty$$x_{k+1}=Az_k$
  • 近似特征值:可用 $\|x_{k+1}\|_\infty$ 近似按模最大特征值。
  • 反幂法目标:求按模最小特征值。
  • 关键转化$A^{-1}x=\lambda^{-1}x$
  • 数值实现:不显式求逆,而是先做 LU 分解,再重复解三角方程组。

参考来源

  • 电子科技大学数学科学学院数值分析课程组:《数值分析》Chap22 PDF 讲义(主参考来源)
  • 本章结构与公式解释严格以本地 PDF 为主,仅对文本抽取混乱处做上下文整理,不使用网页材料覆盖课程脉络。