特征值迭代方法

2026/05/30 09:27:09

模块导航

第一组：问题背景与基本定义 —— Part 0–2
第二组：乘幂法、反幂法与例题 —— Part 3–5
第三组：课程收束与复习 —— Part 6 + 速查

Part 0 · 学习目标

为什么特征值问题不能只靠特征多项式硬算

这一页讨论的是数值分析里一个非常典型的转折：在线性代数中，我们知道特征值满足 $Ax=\lambda x$ ，也知道它来自特征多项式 $|A-\lambda I|=0$ ；但当矩阵阶数很大时，直接解这个多项式既昂贵又不稳定。因此数值分析转而问：能不能不求“全部精确特征值”，而是先迭代逼近最重要的几个？

课件给出的答案是：乘幂法求按模最大特征值，反幂法求按模最小特征值。它们本质上都不是“解方程”，而是反复把向量丢进矩阵的作用里，看哪个方向会被保留下来。

前置知识回顾

特征值与特征向量定义：若 $Ax=\lambda x$ 且 $x\ne 0$ ，则 $\lambda$ 是特征值， $$x$$ 是对应特征向量。
向量范数：本章课件采用 $\infty$ -范数做规范化，即 $\|x\|_\infty=\max_i |x_i|$ 。
线性无关特征向量：乘幂法的理论分析依赖矩阵有一组线性无关特征向量。
LU 分解：反幂法每一步都要解线性方程组，因此会直接调用前面章节的 LU 分解思想。可回看线性方程组与矩阵数值计算。

Part 1 · 背景问题

从“求所有特征值”退一步，先抓住最主导的那个方向

在理论课里，我们常通过特征多项式寻找全部特征值。但当矩阵很大时，这个路线会变得不现实：行列式计算开销高，求高次多项式根也不稳定。数值分析的策略因此转变为：

先只求按模最大特征值，因为它往往主导长期行为；
再进一步通过逆矩阵视角求按模最小特征值；
如果需要，再把这些迭代结果拼成更复杂的特征值算法链。

所以这章最重要的不是“多了两个公式”，而是思维方式的变化：从一次性求解，切换到逐步逼近。

几何直觉：乘幂法像把一个向量不断丢进矩阵产生的“流场”中，最后其余方向被相对压制，只剩主特征方向最显眼。

Part 2 · 概念定义

乘幂法、规范化与反幂法的基本对象

乘幂法的适用前提

设矩阵 $$A$$ 的特征值按模排序为

|\lambda_1|>|\lambda_2|\ge \cdots \ge |\lambda_n|

并且存在一组线性无关特征向量 $u_1,\dots,u_n$ 。若初始向量在 $$u_1$$ 方向上有非零分量，则迭代后会逐步对齐到主特征向量方向。

规范化（Normalization）

直接迭代 $x_{k+1}=Ax_k$ 会遇到两种数值问题：

若 $|\lambda_1|>1$ ，主方向分量会越来越大，可能上溢；
若 $|\lambda_1|<1$ ，分量会越来越小，可能下溢。

因此每一步都要做规范化，把向量缩放回适中量级。

反幂法

若 $$A$$ 非奇异，且 $Ax=\lambda x$ ，则

A^{-1}x=\lambda^{-1}x

于是 $$A$$ 的按模最小特征值，会转化成 $A^{-1}$ 的按模最大特征值问题。反幂法正是基于这一步变换。

Part 3 · 推导

为什么乘幂法会收敛，反幂法为什么要靠解方程而不是显式求逆

乘幂法的主方向保留机制

把初始向量写成特征向量展开：

x_0=a_1u_1+a_2u_2+\cdots+a_nu_n,\qquad a_1\ne 0

则反复乘以 $$A$$ 后有

A^kx_0=\lambda_1^k\left(a_1u_1+a_2\left(\frac{\lambda_2}{\lambda_1}\right)^k u_2+\cdots+a_n\left(\frac{\lambda_n}{\lambda_1}\right)^k u_n\right)

由于对 $i\ge 2$ 有 $|\lambda_i/\lambda_1|<1$ ，故当 $k\to\infty$ 时，后面的分量逐步衰减，向量方向趋近于 $$u_1$$ 。

规范化乘幂法格式

课件采用的规范化方式为

z_k=\frac{x_k}{\|x_k\|_\infty},\qquad x_{k+1}=Az_k

并用

\lambda^{(k+1)}\approx \|x_{k+1}\|_\infty

作为按模最大特征值的近似。若

|\lambda^{(k+1)}-\lambda^{(k)}|<\varepsilon

就停止迭代。

反幂法为什么不显式求逆

虽然理论上是对 $A^{-1}$ 做乘幂法，但数值实现并不直接求逆，而是每一步解

Ax_{k+1}=z_k

若先做

$$A=LU$$

则每一步只需解两个三角方程：

Lw_k=z_k,\qquad Ux_{k+1}=w_k

这样既更稳定，也更高效。随后再取

a^{(k+1)}=\|x_{k+1}\|_\infty,\qquad \lambda^{(k+1)}\approx \frac{1}{a^{(k+1)}}

作为按模最小特征值的近似。

Part 4 · 性质

乘幂法与反幂法的比较

方法	目标	每步核心操作	关键条件	数值注意点
乘幂法	按模最大特征值	矩阵乘向量	$\|\lambda_1\|>\|\lambda_2\|$ 且初值含主方向分量	必须规范化，防止上溢/下溢
反幂法	按模最小特征值	解线性方程组 $$Ax=z$$	$$A$$ 非奇异	不显式求逆，宜先做 LU 分解

Part 5 · 例题与实验

把抽象收敛条件落到具体迭代里

例题 1 · 规范化乘幂法的迭代流程

题目：给定一个 3 阶矩阵、初始向量 $$x_0=(0,0,1)^T$$ 、误差限 $10^{-3}$ ，说明如何按课件流程迭代逼近主特征值。

第一步：取 $z_0=x_0/\|x_0\|_\infty=x_0$ 。
第二步：计算 $$x_1=Az_0$$ ，再取 $\lambda^{(1)}\approx \|x_1\|_\infty$ 。
第三步：规范化得到 $z_1=x_1/\|x_1\|_\infty$ ，再算 $$x_2=Az_1$$ 。
第四步：持续比较相邻两次特征值近似，直到差值小于阈值 $\varepsilon$ 。

答案：这一流程展示的不是单纯算表，而是“矩阵反复强化主方向 + 每步拉回量级”的机制。最终得到的特征向量近似，本质上是规范化后的主方向。

易错点：停止准则比较的是近似特征值差值，不是简单看向量某一分量是否“不再变化”。

例题 2 · 为什么初值不能刚好避开主特征方向

题目：说明为什么若初始向量在主特征向量方向上的系数 $$a_1=0$$ ，乘幂法可能不能收敛到按模最大特征值。

第一步：写出 $x_0=a_1u_1+\cdots+a_nu_n$ 的展开。
第二步：若 $$a_1=0$$ ，则迭代过程中不会凭空“生成” $$u_1$$ 分量。
第三步：因此向量只会在其余特征方向子空间里演化，无法对齐到 $$u_1$$ 。

答案：乘幂法的成功不仅依赖特征值模分离，也依赖初值没有把主方向完全排除掉。

易错点：很多人只记住了

|\lambda_1|>|\lambda_2|

，却忽略了初值方向条件，这会误以为“随便给一个向量都一定行”。

Part 6 · 后续章节

特征值迭代如何回接线性代数与数值线性代数

后续用途 / 连接

这一章把线性代数中的“特征值定义”推进到了“如何数值上逼近特征信息”。乘幂法体现了矩阵乘向量的低成本迭代思想；反幂法则把特征值问题重新接回“解线性方程组”与 LU 分解。后续更高级的特征值算法，很多都可以看成是在这两条思路之上继续发展出来的。

复习速查

乘幂法目标：求按模最大特征值及对应特征向量。
核心条件： $|\lambda_1|>|\lambda_2|$ ，且初值含主特征向量分量。
规范化格式： $z_k=x_k/\|x_k\|_\infty$ ， $x_{k+1}=Az_k$ 。
近似特征值：可用 $\|x_{k+1}\|_\infty$ 近似按模最大特征值。
反幂法目标：求按模最小特征值。
关键转化： $A^{-1}x=\lambda^{-1}x$ 。
数值实现：不显式求逆，而是先做 LU 分解，再重复解三角方程组。

参考来源

电子科技大学数学科学学院数值分析课程组：《数值分析》Chap22 PDF 讲义（主参考来源）
本章结构与公式解释严格以本地 PDF 为主，仅对文本抽取混乱处做上下文整理，不使用网页材料覆盖课程脉络。

上一章数值微分与常微分方程数值解枢纽页数值分析枢纽页