二次型与欧氏空间
第六章是线性代数的集大成章节。它把前三章学到的东西——矩阵、特征值、特征向量——放进了几何框架中。核心问题只有一个:如何最简洁地描述一个平方项构成的函数?
二次型 $f(x_1,\dots,x_n) = \sum_{i,j} a_{ij}x_ix_j$ 本质上是一个实对称矩阵 $A$ 决定的二次函数 $f(X) = X^TAX$。通过欧氏空间中的内积与正交变换,我们可以找到一种坐标系旋转,让这个函数只剩平方项——这就是标准形。
本章覆盖欧氏空间引入与内积、Schmidt 正交化、正交矩阵与正交变换、二次型的矩阵表示、两种标准化方法(配方法与正交变换法)、正定矩阵的判定、二次曲面分类。
前置知识回顾
- 对称矩阵:$A^T = A$。实对称矩阵的所有特征值为实数,且可以正交对角化,来自 。
- 特征值与特征向量:$A\mathbf{v} = \lambda\mathbf{v}$,来自 。
- 坐标系变换:$X = PY$ 改变变量(坐标),在新的基下二次型的矩阵变为 $P^TAP$。
二次型无处不在。考虑平面上一条圆锥曲线:
其二次项部分 $ax^2 + bxy + cy^2$ 就是一个二元二次型。能否通过旋转坐标(去掉 $xy$ 交叉项),让曲线方程变成标准形式 $\lambda_1 x'^2 + \lambda_2 y'^2 = 1$?这正是二次型标准化的几何意义。
更抽象地说:给定一个实对称矩阵 $A$,二次型 $f(X) = X^TAX$ 描述了一个"椭圆"的形状。通过寻找一个正交矩阵 $P$ 使得 $P^TAP$ 成为对角矩阵,我们等价于找到了椭圆的"主轴"方向。这就是主轴定理的核心思想。
二次型的矩阵表示
设 $f(x_1,\dots,x_n) = \displaystyle\sum_{i=1}^n\sum_{j=1}^n a_{ij}x_ix_j$,其中 $a_{ij} \in \mathbb{R}$。
令 $X = (x_1,\dots,x_n)^T$,令 $A = (a_{ij})_{n\times n}$ 且满足 $a_{ij} = a_{ji}$(对称),则
矩阵 $A$ 称为二次型 $f$ 的矩阵。
例:$f(x_1,x_2,x_3) = 2x_1^2 - 3x_2^2 + 4x_3^2 - 2x_1x_2 + 3x_2x_3$,其矩阵为:
注意交叉项系数 $a_{ij}x_ix_j = a_{ji}x_jx_i$ 在矩阵中平分到 $(i,j)$ 和 $(j,i)$ 两个位置,各取原系数的一半。如果原始表达式中的交叉项系数是 $2b_{ij}$,则 $a_{ij}=a_{ji}=b_{ij}$。

在 $\mathbb{R}^n$ 中,我们一直有向量加法和数乘,但没有"长度"和"夹角"的概念。欧氏空间正是在 $\mathbb{R}^n$ 基础上赋予了内积结构。
欧氏空间(内积空间)的定义
设 $V$ 是实数域 $\mathbb{R}$ 上的线性空间。若对 $\forall \alpha,\beta,\gamma \in V$,$k\in\mathbb{R}$,定义了一个二元实函数 $\langle\alpha,\beta\rangle$,满足:
① 对称性:$\langle\alpha,\beta\rangle = \langle\beta,\alpha\rangle$
② 线性性:$\langle k\alpha,\beta\rangle = k\langle\alpha,\beta\rangle$,$\langle\alpha+\beta,\gamma\rangle = \langle\alpha,\gamma\rangle + \langle\beta,\gamma\rangle$
③ 正定性:$\langle\alpha,\alpha\rangle \ge 0$,且等号成立 $\iff \alpha = 0$
则称 $\langle\cdot,\cdot\rangle$ 为 $V$ 上的内积,$V$ 称为欧几里得空间(欧氏空间)。
标准内积(点积)
在 $\mathbb{R}^n$ 中,最常用的内积是标准内积:对 $\alpha=(a_1,\dots,a_n)^T,\ \beta=(b_1,\dots,b_n)^T$,
由此可以定义向量的长度(范数) $\|\alpha\| = \sqrt{\langle\alpha,\alpha\rangle}$,以及夹角 $\cos\theta = \dfrac{\langle\alpha,\beta\rangle}{\|\alpha\|\cdot\|\beta\|}$。
其他内积的例子:在连续函数空间 $C[a,b]$ 上,可以定义 $\langle f,g\rangle = \displaystyle\int_a^b f(x)g(x)\,dx$,这也构成一个内积空间。
内积的正定性为何重要?
正定性 $\langle\alpha,\alpha\rangle \ge 0$ 保证了向量长度非负,这是几何直觉的基础。第三条性质的"等号成立 $\iff \alpha=0$"确保零向量是唯一长度为 0 的向量。这个条件在正定矩阵的定义中以同样的形式出现:$X^TAX > 0$ 对所有 $X\neq 0$ 成立。
正交与正交基
若 $\langle\alpha,\beta\rangle = 0$,称 $\alpha$ 与 $\beta$ 正交,记作 $\alpha \perp \beta$。
一组非零向量 $\alpha_1,\dots,\alpha_m$ 两两正交,称为正交向量组。
若此外每个向量都是单位向量(长度为 1),则称为标准正交向量组。
维数为 $n$ 的欧氏空间中,由 $n$ 个两两正交的单位向量构成的基称为标准正交基。
给定欧氏空间 $V$ 的一组基 $\alpha_1,\dots,\alpha_m$,我们总可以构造出一组标准正交基。Gram-Schmidt 正交化的核心思想:每次取一个新向量,减去它在已正交化向量上的投影。
Gram-Schmidt 正交化公式
输入:线性无关组 $\alpha_1,\alpha_2,\dots,\alpha_m$
输出:正交组 $\beta_1,\beta_2,\dots,\beta_m$
再令 $\gamma_k = \dfrac{\beta_k}{\|\beta_k\|}$,则 $\gamma_1,\dots,\gamma_m$ 构成标准正交组。
几何直觉:$\beta_k$ 就是 $\alpha_k$ 减去它在 $\text{span}\{\beta_1,\dots,\beta_{k-1}\}$ 上的正交投影。剩下的部分必然垂直于整个已构造的子空间。
例题 1:Gram-Schmidt 正交化
题目:在 $\mathbb{R}^3$(标准内积)中,给定基 $\alpha_1=(1,1,1)^T,\ \alpha_2=(1,0,1)^T,\ \alpha_3=(0,1,1)^T$,用 Gram-Schmidt 正交化构造一组标准正交基。
目标:掌握正交化过程的每一步——投影、减法、归一化。
- 取 $\beta_1 = \alpha_1$:$\beta_1 = (1,1,1)^T$。
- 计算 $\beta_2$:$\beta_2 = \alpha_2 - \dfrac{\langle\alpha_2,\beta_1\rangle}{\langle\beta_1,\beta_1\rangle}\beta_1$。
先算内积:$\langle\alpha_2,\beta_1\rangle = 1\cdot1 + 0\cdot1 + 1\cdot1 = 2$,$\langle\beta_1,\beta_1\rangle = 1^2+1^2+1^2 = 3$。
投影系数 $= \frac{2}{3}$。因此 $\beta_2 = (1,0,1)^T - \frac{2}{3}(1,1,1)^T = \left(\frac{1}{3}, -\frac{2}{3}, \frac{1}{3}\right)^T$。
- 计算 $\beta_3$:$\beta_3 = \alpha_3 - \dfrac{\langle\alpha_3,\beta_1\rangle}{\langle\beta_1,\beta_1\rangle}\beta_1 - \dfrac{\langle\alpha_3,\beta_2\rangle}{\langle\beta_2,\beta_2\rangle}\beta_2$。
$\langle\alpha_3,\beta_1\rangle = 0+1+1 = 2$,投影系数对 $\beta_1$ 为 $\frac{2}{3}$。
$\langle\alpha_3,\beta_2\rangle = 0\cdot\frac{1}{3} + 1\cdot(-\frac{2}{3}) + 1\cdot\frac{1}{3} = -\frac{1}{3}$,$\langle\beta_2,\beta_2\rangle = (\frac{1}{3})^2 + (-\frac{2}{3})^2 + (\frac{1}{3})^2 = \frac{6}{9} = \frac{2}{3}$,投影系数对 $\beta_2$ 为 $-\frac{1}{2}$。
因此 $\beta_3 = (0,1,1)^T - \frac{2}{3}(1,1,1)^T - (-\frac{1}{2})(\frac{1}{3},-\frac{2}{3},\frac{1}{3})^T$
- 整理 $\beta_3$:
$\beta_3 = (0,1,1) - (\frac{2}{3},\frac{2}{3},\frac{2}{3}) + (\frac{1}{6},-\frac{1}{3},\frac{1}{6}) = (-\frac{1}{2},0,\frac{1}{2})$。
- 归一化:
$\gamma_1 = \dfrac{\beta_1}{\|\beta_1\|} = \frac{1}{\sqrt{3}}(1,1,1)^T$,
$\gamma_2 = \dfrac{\beta_2}{\|\beta_2\|} = \frac{\sqrt{3}}{\sqrt{2}}(\frac{1}{3},-\frac{2}{3},\frac{1}{3})^T = (\frac{1}{\sqrt{6}},-\frac{2}{\sqrt{6}},\frac{1}{\sqrt{6}})^T$,
$\gamma_3 = \dfrac{\beta_3}{\|\beta_3\|} = \frac{(\frac{1}{2},0,-\frac{1}{2})}{\frac{1}{\sqrt{2}}} = (-\frac{1}{\sqrt{2}},0,\frac{1}{\sqrt{2}})^T$。
答案:标准正交基为 $\left\{ \frac{1}{\sqrt{3}}(1,1,1)^T,\ \frac{1}{\sqrt{6}}(1,-2,1)^T,\ \frac{1}{\sqrt{2}}(-1,0,1)^T \right\}$。
QR 分解:若将 $\alpha_1,\dots,\alpha_n$ 排成矩阵 $A$ 的列,Gram-Schmidt 正交化等价于求出 $A = QR$,其中 $Q$ 的列是标准正交向量,$R$ 是上三角矩阵记录投影系数。
在欧氏空间中,有一类特殊的线性变换——正交变换——它不改变向量的长度和夹角。直观上这就是"旋转"和"镜面反射"。
正交变换
设 $T: V\to V$ 是欧氏空间 $V$ 上的线性变换。若对 $\forall \alpha,\beta \in V$,有
则称 $T$ 为正交变换。
正交变换的等价条件(以下三个等价):
- 保持内积:$\langle T(\alpha), T(\beta)\rangle = \langle\alpha,\beta\rangle$
- 保持长度:$\|T(\alpha)\| = \|\alpha\|$
- 在标准正交基下的矩阵是正交矩阵
正交矩阵
$n$ 阶实方阵 $Q$ 称为正交矩阵,若满足
等价性质:
- $Q$ 的行(列)向量构成 $\mathbb{R}^n$ 的一组标准正交基
- $\det(Q) = \pm 1$($\det = +1$ 是旋转变换,$\det = -1$ 含反射成分)
- $Q$ 的特征值的模长均为 1
正交变换化二次型为标准形的核心定理
主轴定理(正交对角化)
设 $A$ 是 $n$ 阶实对称矩阵,则存在正交矩阵 $Q$,使得
其中 $\lambda_1,\dots,\lambda_n$ 是 $A$ 的特征值(按任意顺序排列)。$Q$ 的列是对应于这些特征值的标准正交特征向量。
这个定理的意义:任何实对称矩阵都可以通过正交变换对角化。对二次型来说,$X = QY$ 将 $f(X) = X^TAX$ 化为
这就是二次型的标准形(也是规范形,因为特征值符号已经唯一确定)。
化二次型为标准形有两种主流方法:配方法可以手工计算、过程直观;正交变换法理论优美、几何意义明确。
配方法(Lagrange 配方法)
适用场景:低阶($n\le 3$)二次型,手工计算。
步骤:
- 若存在平方项 $a_{ii} \neq 0$:将所有含 $x_i$ 的项合并,配方,剩余部分不含 $x_i$
- 若完全没有平方项(所有 $a_{ii}=0$):先做一次可逆线性替换 $x_i = y_i + y_j,\ x_j = y_i - y_j$ 制造平方项
- 递归进行直到只剩平方项
局限性:变换矩阵 $P$ 不是正交矩阵(只是可逆矩阵),因此几何意义不如正交变换法清晰。配方法得到的是合同变换而非相似变换。
正交变换法
步骤:
- 写出二次型的对称矩阵 $A$
- 求 $A$ 的特征值 $\lambda_1,\dots,\lambda_n$
- 对每个特征值,求对应的特征向量
- 对重特征值的特征向量做 Schmidt 正交化
- 将所有标准正交特征向量排成正交矩阵 $Q$
- $X = QY$ 即得标准形 $\sum \lambda_i y_i^2$
例题 2:用正交变换化二次型为标准形
题目:将二次型 $f(x_1,x_2,x_3) = 2x_1^2 + 5x_2^2 + 5x_3^2 + 4x_1x_2 - 4x_1x_3 - 8x_2x_3$ 通过正交变换化为标准形。
目标:掌握正交变换法的完整六步流程。
- 写出矩阵:$A = \begin{pmatrix}2 & 2 & -2 \\ 2 & 5 & -4 \\ -2 & -4 & 5\end{pmatrix}$。
- 求特征值:解 $\det(A - \lambda I) = 0$。
$$\det\begin{pmatrix}2-\lambda & 2 & -2 \\ 2 & 5-\lambda & -4 \\ -2 & -4 & 5-\lambda\end{pmatrix} = 0$$
展开得 $(2-\lambda)(\lambda^2 - 10\lambda + 9) + 2(2\lambda-8) - 2(-2\lambda+8) = 0$,化简得 $-\lambda^3 + 12\lambda^2 - 21\lambda + 10 = 0$,即 $\lambda^3 - 12\lambda^2 + 21\lambda - 10 = 0$。
因式分解:$(\lambda-1)(\lambda^2 - 11\lambda + 10) = (\lambda-1)^2(\lambda-10) = 0$。
- 特征值:$\lambda_1 = 10$(单根),$\lambda_2 = \lambda_3 = 1$(二重根)。
- 求 $\lambda_1 = 10$ 的特征向量:解 $(A-10I)\mathbf{v} = 0$。
$\begin{pmatrix}-8 & 2 & -2 \\ 2 & -5 & -4 \\ -2 & -4 & -5\end{pmatrix}\mathbf{v} = 0$,得 $\mathbf{v}_1 = (1, -2, 2)^T$。归一化:$\mathbf{q}_1 = \frac{1}{3}(1, -2, 2)^T$。
- 求 $\lambda = 1$ 的特征向量:解 $(A-I)\mathbf{v} = 0$。
$\begin{pmatrix}1 & 2 & -2 \\ 2 & 4 & -4 \\ -2 & -4 & 4\end{pmatrix}\mathbf{v} = 0$,即 $x_1 + 2x_2 - 2x_3 = 0$。取正交于 $\mathbf{v}_1$ 的两个解:
$\mathbf{v}_2 = (-2, 1, 0)^T$,$\mathbf{v}_3 = (2, 0, 1)^T$(代入验证满足方程且与 $\mathbf{v}_1$ 正交)。
对 $\mathbf{v}_2,\mathbf{v}_3$ 做 Schmidt 正交化:取 $\beta_2 = \mathbf{v}_2$,$\beta_3 = \mathbf{v}_3 - \frac{\langle\mathbf{v}_3,\beta_2\rangle}{\langle\beta_2,\beta_2\rangle}\beta_2$。
$\langle\mathbf{v}_3,\beta_2\rangle = 2(-2)+0\cdot1+1\cdot0 = -4$,$\langle\beta_2,\beta_2\rangle = 4+1+0=5$。
$\beta_3 = (2,0,1) - \frac{-4}{5}(-2,1,0) = (2,0,1) - (\frac{8}{5},-\frac{4}{5},0) = (\frac{2}{5},\frac{4}{5},1) = \frac{1}{5}(2,4,5)$。
$\mathbf{q}_2 = \frac{(-2,1,0)}{\sqrt{5}}$,$\mathbf{q}_3 = \frac{(2,4,5)}{3\sqrt{5}}$。
- 构造正交矩阵 $Q$ 得标准形:
$Q = \begin{pmatrix}\frac{1}{3} & -\frac{2}{\sqrt{5}} & \frac{2}{3\sqrt{5}} \\ -\frac{2}{3} & \frac{1}{\sqrt{5}} & \frac{4}{3\sqrt{5}} \\ \frac{2}{3} & 0 & \frac{5}{3\sqrt{5}}\end{pmatrix}$,
作 $X = QY$,得标准形 $f = 10y_1^2 + y_2^2 + y_3^2$。
答案:标准形为 $10y_1^2 + y_2^2 + y_3^2$,正交变换矩阵为 $Q$。
惯性定理:无论用什么方法化标准形,标准形中正系数的个数 $p$ 和负系数的个数 $q$ 是唯一确定的。$(p,q)$ 称为二次型的惯性指数。正系数个数 $p$ 也称为正惯性指数,负系数个数 $q$ 为负惯性指数。规范形写作
秩 $r = p + q$ 是矩阵 $A$ 的秩,也是二次型中非零平方项的项数。
正定性的研究来源于一个简单问题:什么时候二次型 $f(X)$ 的最小值是正的?
正定二次型 / 正定矩阵
设 $f(X) = X^TAX$ 是实二次型($A$ 为对称矩阵)。若对 $\forall X \neq 0$,恒有
则称 $f$ 为正定二次型,$A$ 为正定矩阵。
判定方法一览表
| 方法 | 正定条件 | 负定条件 | 半正定条件 |
|---|---|---|---|
| 特征值法 | 所有 $\lambda_i > 0$ | 所有 $\lambda_i < 0$ | 所有 $\lambda_i \ge 0$ |
| 顺序主子式法 | 所有 $\Delta_k > 0$ | $\Delta_1 < 0,\ \Delta_2 > 0,\ \Delta_3 < 0,\ \dots$ | 所有 $\Delta_k \ge 0$(不充分,需结合特征值) |
| 配方法 | 标准形平方项全正 | 标准形平方项全负 | 标准形所有平方项非负 |
其中 $\Delta_k$ 是 $A$ 的 $k$ 阶顺序主子式:
例题 3:判断正定性
题目:判断矩阵 $A = \begin{pmatrix}5 & 2 & -1 \\ 2 & 2 & 1 \\ -1 & 1 & 3\end{pmatrix}$ 是否正定。
目标:掌握顺序主子式法和特征值法两种判断途径。
法一:顺序主子式法
- 一阶主子式:$\Delta_1 = 5 > 0$ ✓
- 二阶主子式:$\Delta_2 = \det\begin{pmatrix}5 & 2 \\ 2 & 2\end{pmatrix} = 5\cdot2 - 2\cdot2 = 10 - 4 = 6 > 0$ ✓
- 三阶主子式:$\Delta_3 = \det\begin{pmatrix}5 & 2 & -1 \\ 2 & 2 & 1 \\ -1 & 1 & 3\end{pmatrix}$。
按第一行展开:$5\cdot\det\begin{pmatrix}2 & 1 \\ 1 & 3\end{pmatrix} - 2\cdot\det\begin{pmatrix}2 & 1 \\ -1 & 3\end{pmatrix} + (-1)\cdot\det\begin{pmatrix}2 & 2 \\ -1 & 1\end{pmatrix}$
$= 5(6-1) - 2(6+1) - 1(2+2) = 5\cdot5 - 2\cdot7 - 4 = 25 - 14 - 4 = 7 > 0$ ✓
法二:特征值法
解 $\det(A-\lambda I)=0$:$\det\begin{pmatrix}5-\lambda & 2 & -1 \\ 2 & 2-\lambda & 1 \\ -1 & 1 & 3-\lambda\end{pmatrix} = 0$。 计算得 $-\lambda^3 + 10\lambda^2 - 20\lambda + 7 = 0$,即 $\lambda^3 - 10\lambda^2 + 20\lambda - 7 = 0$。
尝试 $\lambda=1$:$1 - 10 + 20 - 7 = 4 \neq 0$;$\lambda=7$:$343 - 490 + 140 - 7 = -14 \neq 0$。
说明三个特征值都不是简单整数根。但由顺序主子式法已能判定——三个主子式都正,故而 $A$ 是正定矩阵。这体现了顺序主子式法的优势:避免解三次方程。
答案:$A$ 是正定矩阵。
正定矩阵的重要性质
- 正定矩阵的所有主对角线元素 $a_{ii} > 0$(必要条件,非充分)
- 正定矩阵的所有特征值 $> 0$
- 正定矩阵的行列式 $> 0$
- 若 $A$ 正定,则存在唯一的下三角矩阵 $L$(对角元正)使得 $A = LL^T$(Cholesky 分解)
- 正定矩阵 $+$ 正定矩阵 $=$ 正定矩阵;正定矩阵乘正数 $=$ 正定矩阵
例题:实对称正定矩阵的矩阵分解
设 $A \in \mathbb{R}^{3\times3}$ 是实对称正定矩阵,下列哪一种分解一定存在且唯一?
- LU 分解:$A = LU$($L$ 为单位下三角矩阵)
- QR 分解:$A = QR$
- 奇异值分解(SVD):$A = U\Sigma V^T$
- Cholesky 分解:$A = LL^T$($L$ 为下三角、对角元为正)
分析:
- 选项 A(LU):对任意非奇异矩阵的 LU 分解不一定存在;若高斯消元过程中出现零主元,需要行置换(PA = LU)。对 SPD 矩阵,高斯消元主元均正,因此 LU 分解存在;但唯一性需指定 $L$ 为单位下三角,此时唯一。
- 选项 B(QR):QR 分解存在且不唯一。Gram-Schmidt 正交化得到的 $Q$ 不唯一(取决于正交化顺序),Householder 反射也涉及符号选择。
- 选项 C(SVD):SVD 存在但不唯一。$U, V^T$ 均可乘以反射矩阵($\det = -1$)得到新的分解。
- 选项 D(Cholesky):对 SPD 矩阵,存在唯一的下三角矩阵 $L$(对角元为正)使得 $A = LL^T$。这是正定矩阵的特征性质,也是数值计算中求解正定线性方程组最常用的方法。
答案:D——Cholesky 分解是实对称正定矩阵存在且唯一的分解。
负定、半正定、不定
- 负定:$X^TAX < 0$ 对所有 $X \neq 0$ 成立 $\iff$ 所有特征值 $< 0$ $\iff$ 奇数阶顺序主子式 $< 0$、偶数阶 $> 0$
- 半正定:$X^TAX \ge 0$ 对所有 $X \neq 0$ 成立 $\iff$ 所有特征值 $\ge 0$
- 不定:$X^TAX$ 可正可负 $\iff$ 特征值有正有负
第二章学过 LU 分解——对任意方阵在高斯消元时不选主元的一种分解。Cholesky 分解是 LU 分解在对称正定矩阵上的特化版本,利用对称性大幅降低计算量和存储需求。
Cholesky 分解定理
若 $A \in \mathbb{R}^{n \times n}$ 是实对称正定矩阵,则存在唯一的下三角矩阵 $L$(对角元均为正数),使得
其中 $L$ 的对角元 $> 0$,且分解唯一。
为什么唯一?
对称正定 $\Rightarrow$ 所有顺序主子式 $\Delta_k > 0$ $\Rightarrow$ 高斯消元不选主元时 LU 分解唯一(第二章定理)。设 $A = \tilde{L}U$,其中 $\tilde{L}$ 为单位下三角,$U$ 为上三角。由对称性 $A = A^T = U^T \tilde{L}^T$,唯一性定理保证 $\tilde{L} = U^T$,记 $U = D\tilde{U}$($D = \operatorname{diag}(u_{11},\dots,u_{nn})$,$\tilde{U}$ 为单位上三角),则 $A = \tilde{L}D\tilde{U}$。由对称性 $\tilde{L} = \tilde{U}^T$,于是 $A = \tilde{U}^TD\tilde{U}$。正定性保证 $D > 0$(对角元为正),令 $L = \tilde{U}^T\sqrt{D}$($\sqrt{D}$ 逐元开方),则 $A = LL^T$。
计算公式(逐行推导)
设 $L = (\ell_{ij})$,由 $A = LL^T$ 按行展开:
- 对角元:$\ell_{ii} = \sqrt{a_{ii} - \sum_{k=1}^{i-1} \ell_{ik}^2}$
- 下三角元:$\ell_{ij} = \dfrac{a_{ij} - \sum_{k=1}^{j-1} \ell_{ik}\ell_{jk}}{\ell_{jj}}$,其中 $i > j$
每一行需要先计算对角元 $\ell_{jj}$,再算该行左侧所有 $\ell_{ij}$。计算量约为 $\frac{1}{6}n^3$,是 LU 分解的一半。
例题:$2 \times 2$ 矩阵的 Cholesky 分解
题目:设 $A = \begin{pmatrix}4 & 2 \\ 2 & 5\end{pmatrix}$,求 Cholesky 分解 $A = LL^T$。
- $\ell_{11} = \sqrt{a_{11}} = \sqrt{4} = 2$
- $\ell_{21} = \dfrac{a_{21}}{\ell_{11}} = \dfrac{2}{2} = 1$
- $\ell_{22} = \sqrt{a_{22} - \ell_{21}^2} = \sqrt{5 - 1} = \sqrt{4} = 2$
验证:$LL^T = \begin{pmatrix}2 & 0 \\ 1 & 2\end{pmatrix}\begin{pmatrix}2 & 1 \\ 0 & 2\end{pmatrix} = \begin{pmatrix}4 & 2 \\ 2 & 5\end{pmatrix} = A$ ✓
Cholesky 分解 vs LU 分解
| 对比项 | LU 分解 | Cholesky 分解 |
|---|---|---|
| 适用条件 | 所有顺序主子式 $\Delta_k \neq 0$ | 对称正定($\Delta_k > 0$) |
| 唯一性 | 需指定 $L$ 为单位下三角时唯一 | 唯一($L$ 对角元强制为正) |
| 计算量 | $\frac{1}{3}n^3$ | $\frac{1}{6}n^3$(减半) |
| 存储优势 | 需存 $L$ 和 $U$ 两个矩阵 | 只需存 $L$($U = L^T$ 是冗余信息) |
| 数值稳定性 | 一般,需选主元增强 | 天然稳定(无需选主元) |
核心应用
- 求解正定线性方程组:$Ax = b \Rightarrow LL^Tx = b \Rightarrow Ly = b,\ L^Tx = y$,两步回代,$O(n^2)$
- 计算行列式:$\det(A) = \prod_{i=1}^n \ell_{ii}^2$
- 多元正态分布:协方差矩阵 $\Sigma = LL^T$,$L$ 用于随机采样(Cholesky 采样)
- 最小二乘法:法方程 $A^TAx = A^Tb$ 的求解
三维空间中的二次曲面定义为 $(x,y,z)$ 满足的二次方程:
写成矩阵形式:$X^TAX + B^TX + c = 0$,其中 $A$ 是对称矩阵。通过正交变换(旋转移除交叉项)和平移(移除一次项),任何二次曲面都可以化为标准位置。
九种标准二次曲面
| 类型 | 标准方程 | 几何特征 | 图示特征 |
|---|---|---|---|
| 椭球面 | $\dfrac{x^2}{a^2} + \dfrac{y^2}{b^2} + \dfrac{z^2}{c^2} = 1$ | 有界、封闭、三轴对称 | $a=b=c$ 时退化为球面 |
| 单叶双曲面 | $\dfrac{x^2}{a^2} + \dfrac{y^2}{b^2} - \dfrac{z^2}{c^2} = 1$ | 无界、连通、一个负号 | 绕 $z$ 轴旋转 |
| 双叶双曲面 | $\dfrac{x^2}{a^2} + \dfrac{y^2}{b^2} - \dfrac{z^2}{c^2} = -1$ | 无界、两叶、两个负号 | 只有 $|z| \ge c$ 时有图形 |
| 椭圆抛物面 | $z = \dfrac{x^2}{a^2} + \dfrac{y^2}{b^2}$ | 无界、开口向上、碗状 | $a=b$ 时是旋转抛物面 |
| 双曲抛物面 | $z = \dfrac{x^2}{a^2} - \dfrac{y^2}{b^2}$ | 马鞍面、无界 | 在 $z=0$ 处为两条相交直线 |
| 椭圆柱面 | $\dfrac{x^2}{a^2} + \dfrac{y^2}{b^2} = 1$ | 母线平行 $z$ 轴 | $z$ 无约束 |
| 双曲柱面 | $\dfrac{x^2}{a^2} - \dfrac{y^2}{b^2} = 1$ | 母线平行 $z$ 轴 | 双曲线沿 $z$ 轴平移 |
| 抛物柱面 | $y = ax^2$ | 母线平行 $z$ 轴 | 抛物线沿 $z$ 轴平移 |
| 锥面 | $\dfrac{x^2}{a^2} + \dfrac{y^2}{b^2} - \dfrac{z^2}{c^2} = 0$ | 过原点的锥形 | $z$ 方向展开 |
二次曲面分类判据
设二次型矩阵 $A$ 的特征值为 $\lambda_1,\lambda_2,\lambda_3$(已符号分类),结合一次项的有无:
- 三个同号 → 椭球面(等号右侧为正)或虚椭球面(无实点)或点(零解)
- 两个同号、一个异号 → 单叶双曲面(右侧正)或双叶双曲面(右侧负)或锥面(右侧零)
- 两个同号、一个为 0,且有一次项 → 椭圆/双曲抛物面
实际中通过正交变换化二次项为标准形后,再配方平移移除一次项,即可确定曲面类型。
实际操作步骤:
- 分离二次项和一次项:$F(x,y,z) = X^TAX + B^TX + c$
- 对 $A$ 做正交对角化:$Q^TAQ = \operatorname{diag}(\lambda_1,\lambda_2,\lambda_3)$
- 作变换 $X = QY$ 消去交叉项,一次项变为 $B^TQY$
- 对每个变量配方(完全平方),平移坐标系消去一次项
- 根据最终方程形式对照标准表分类
复习速查
| 概念 | 定义 / 公式 | 关键点 |
|---|---|---|
| 二次型的矩阵 | $f(X) = X^TAX$,$A$ 对称 | $a_{ij} = a_{ji}$,交叉项系数平分 |
| 欧氏空间 | 线性空间 $+$ 内积 | 对称性 + 线性性 + 正定性 |
| Schmidt 正交化 | $\beta_k = \alpha_k - \sum_{i<k}\frac{\langle\alpha_k,\beta_i\rangle}{\langle\beta_i,\beta_i\rangle}\beta_i$ | 投影减法的迭代过程 |
| 正交矩阵 $Q$ | $Q^TQ = I \iff Q^{-1} = Q^T$ | $\det Q = \pm 1$,列向量标准正交 |
| 正交变换标准形 | $Q^TAQ = \operatorname{diag}(\lambda_1,\dots,\lambda_n)$ | 特征值按大小排列,对应特征向量排成 $Q$ |
| 惯性指数 $(p,q)$ | $f = y_1^2+\cdots+y_p^2 - y_{p+1}^2 - \cdots - y_{p+q}^2$ | 与标准化方法无关,唯一确定 |
| 正定矩阵 | $X^TAX > 0$ 对所有 $X \neq 0$ | 等价于所有特征值 $> 0$,所有顺序主子式 $> 0$ |
| 主轴定理 | 实对称矩阵 $\xrightarrow{\text{正交矩阵}}$ 对角矩阵 | $Q$ 的标准正交特征向量即为主轴方向 |
| Cholesky 分解 | $A = LL^T$(正定矩阵) | $L$ 是下三角、对角元为正 |
参考来源
- 电子科技大学线性代数课程组(邓良剑):线性代数枢纽页 · 讲义 PDF(6.1 二次型与欧氏空间、6.2 正定二次型、6.3 二次曲面、6.4 综合练习)
- Wikipedia 正定矩阵词条:https://zh.wikipedia.org/wiki/正定矩阵 — 顺序主子式判定法与 Cholesky 分解
- Wikipedia 正交矩阵词条:https://zh.wikipedia.org/wiki/正交矩阵 — 保持距离不变与旋转/反射的几何解释
- Wikipedia Gram-Schmidt 正交化:https://zh.wikipedia.org/wiki/格拉姆-施密特正交化 — 数值不稳定性与 QR 分解
- CSDN 二次型化标准形五种方法:https://blog.csdn.net/weixin_45826022/article/details/106214444 — 配方法、初等变换法、正交变换法详解
- 半正定矩阵详解:https://kavinwkp.github.io/2021/10/09/Math-线性代数-半正定矩阵/ — 特征值与 Hessian 矩阵应用
- 中科大二次曲面讲义:http://staff.ustc.edu.cn/~rui/ppt/math-analysis/chap8_3.html — 椭球面、双曲面、抛物面标准形