ESC
输入关键词搜索文章
目录

二次型与欧氏空间

线性代数 · 第六章
从度量空间到标准形——正交性与二次型的优雅世界
Part 0 · 学习目标
二次型与欧氏空间:从平方和到度量

第六章是线性代数的集大成章节。它把前三章学到的东西——矩阵、特征值、特征向量——放进了几何框架中。核心问题只有一个:如何最简洁地描述一个平方项构成的函数?

二次型 $f(x_1,\dots,x_n) = \sum_{i,j} a_{ij}x_ix_j$ 本质上是一个实对称矩阵 $A$ 决定的二次函数 $f(X) = X^TAX$。通过欧氏空间中的内积与正交变换,我们可以找到一种坐标系旋转,让这个函数只剩平方项——这就是标准形。

本章覆盖欧氏空间引入与内积、Schmidt 正交化、正交矩阵与正交变换、二次型的矩阵表示、两种标准化方法(配方法与正交变换法)、正定矩阵的判定、二次曲面分类。

前置知识回顾

  • 对称矩阵$A^T = A$。实对称矩阵的所有特征值为实数,且可以正交对角化,来自
    PDF实对称矩阵的对角化p.1

    pdf/线性代数/5.3.pdf · p.1

    打开原文

  • 特征值与特征向量$A\mathbf{v} = \lambda\mathbf{v}$,来自
    PDF特征值与特征向量p.1

    pdf/线性代数/5.1.pdf · p.1

    打开原文

  • 坐标系变换$X = PY$ 改变变量(坐标),在新的基下二次型的矩阵变为 $P^TAP$
Part 1 · 背景问题
为什么要研究二次型?

二次型无处不在。考虑平面上一条圆锥曲线:

$$ax^2 + bxy + cy^2 + dx + ey + f = 0$$

其二次项部分 $ax^2 + bxy + cy^2$ 就是一个二元二次型。能否通过旋转坐标(去掉 $xy$ 交叉项),让曲线方程变成标准形式 $\lambda_1 x'^2 + \lambda_2 y'^2 = 1$?这正是二次型标准化的几何意义。

更抽象地说:给定一个实对称矩阵 $A$,二次型 $f(X) = X^TAX$ 描述了一个"椭圆"的形状。通过寻找一个正交矩阵 $P$ 使得 $P^TAP$ 成为对角矩阵,我们等价于找到了椭圆的"主轴"方向。这就是主轴定理的核心思想。

二次型的矩阵表示

$f(x_1,\dots,x_n) = \displaystyle\sum_{i=1}^n\sum_{j=1}^n a_{ij}x_ix_j$,其中 $a_{ij} \in \mathbb{R}$

$X = (x_1,\dots,x_n)^T$,令 $A = (a_{ij})_{n\times n}$ 且满足 $a_{ij} = a_{ji}$(对称),则

$$f(x_1,\dots,x_n) = X^TAX$$

矩阵 $A$ 称为二次型 $f$ 的矩阵

例:$f(x_1,x_2,x_3) = 2x_1^2 - 3x_2^2 + 4x_3^2 - 2x_1x_2 + 3x_2x_3$,其矩阵为:

$$A = \begin{pmatrix}2 & -1 & 0 \\ -1 & -3 & \frac{3}{2} \\ 0 & \frac{3}{2} & 4\end{pmatrix}$$

注意交叉项系数 $a_{ij}x_ix_j = a_{ji}x_jx_i$ 在矩阵中平分到 $(i,j)$$(j,i)$ 两个位置,各取原系数的一半。如果原始表达式中的交叉项系数是 $2b_{ij}$,则 $a_{ij}=a_{ji}=b_{ij}$

PDF二次型定义与矩阵表示p.2

pdf/线性代数/6.1.pdf · p.2

打开原文

欧氏空间
欧氏空间引入 · 电子科技大学线性代数课件
Part 2 · 欧氏空间与内积
引入度量——内积空间

$\mathbb{R}^n$ 中,我们一直有向量加法和数乘,但没有"长度"和"夹角"的概念。欧氏空间正是在 $\mathbb{R}^n$ 基础上赋予了内积结构。

PDF欧氏空间引入p.3

pdf/线性代数/6.1.pdf · p.3

打开原文

欧氏空间(内积空间)的定义

$V$ 是实数域 $\mathbb{R}$ 上的线性空间。若对 $\forall \alpha,\beta,\gamma \in V$$k\in\mathbb{R}$,定义了一个二元实函数 $\langle\alpha,\beta\rangle$,满足:

对称性$\langle\alpha,\beta\rangle = \langle\beta,\alpha\rangle$

线性性$\langle k\alpha,\beta\rangle = k\langle\alpha,\beta\rangle$$\langle\alpha+\beta,\gamma\rangle = \langle\alpha,\gamma\rangle + \langle\beta,\gamma\rangle$

正定性$\langle\alpha,\alpha\rangle \ge 0$,且等号成立 $\iff \alpha = 0$

则称 $\langle\cdot,\cdot\rangle$$V$ 上的内积$V$ 称为欧几里得空间(欧氏空间)

标准内积(点积)

$\mathbb{R}^n$ 中,最常用的内积是标准内积:对 $\alpha=(a_1,\dots,a_n)^T,\ \beta=(b_1,\dots,b_n)^T$

$$\langle\alpha,\beta\rangle = \sum_{i=1}^n a_ib_i = \alpha^T\beta$$

由此可以定义向量的长度(范数) $\|\alpha\| = \sqrt{\langle\alpha,\alpha\rangle}$,以及夹角 $\cos\theta = \dfrac{\langle\alpha,\beta\rangle}{\|\alpha\|\cdot\|\beta\|}$

其他内积的例子:在连续函数空间 $C[a,b]$ 上,可以定义 $\langle f,g\rangle = \displaystyle\int_a^b f(x)g(x)\,dx$,这也构成一个内积空间。

内积的正定性为何重要?

正定性 $\langle\alpha,\alpha\rangle \ge 0$ 保证了向量长度非负,这是几何直觉的基础。第三条性质的"等号成立 $\iff \alpha=0$"确保零向量是唯一长度为 0 的向量。这个条件在正定矩阵的定义中以同样的形式出现:$X^TAX > 0$ 对所有 $X\neq 0$ 成立。

正交与正交基

$\langle\alpha,\beta\rangle = 0$,称 $\alpha$$\beta$ 正交,记作 $\alpha \perp \beta$

一组非零向量 $\alpha_1,\dots,\alpha_m$ 两两正交,称为正交向量组

若此外每个向量都是单位向量(长度为 1),则称为标准正交向量组

维数为 $n$ 的欧氏空间中,由 $n$ 个两两正交的单位向量构成的基称为标准正交基

Part 3 · Schmidt 正交化——从任意基到标准正交基
用投影操作构造正交基

给定欧氏空间 $V$ 的一组基 $\alpha_1,\dots,\alpha_m$,我们总可以构造出一组标准正交基。Gram-Schmidt 正交化的核心思想:每次取一个新向量,减去它在已正交化向量上的投影

PDFSchmidt正交化方法p.8

pdf/线性代数/6.1.pdf · p.8

打开原文

Gram-Schmidt 正交化公式

输入:线性无关组 $\alpha_1,\alpha_2,\dots,\alpha_m$

输出:正交组 $\beta_1,\beta_2,\dots,\beta_m$

$$\begin{aligned} \beta_1 &= \alpha_1 \\ \beta_2 &= \alpha_2 - \frac{\langle\alpha_2,\beta_1\rangle}{\langle\beta_1,\beta_1\rangle}\beta_1 \\ \beta_3 &= \alpha_3 - \frac{\langle\alpha_3,\beta_1\rangle}{\langle\beta_1,\beta_1\rangle}\beta_1 - \frac{\langle\alpha_3,\beta_2\rangle}{\langle\beta_2,\beta_2\rangle}\beta_2 \\ &\ \vdots \\ \beta_k &= \alpha_k - \sum_{i=1}^{k-1}\frac{\langle\alpha_k,\beta_i\rangle}{\langle\beta_i,\beta_i\rangle}\beta_i \end{aligned}$$

再令 $\gamma_k = \dfrac{\beta_k}{\|\beta_k\|}$,则 $\gamma_1,\dots,\gamma_m$ 构成标准正交组。

几何直觉:$\beta_k$ 就是 $\alpha_k$ 减去它在 $\text{span}\{\beta_1,\dots,\beta_{k-1}\}$ 上的正交投影。剩下的部分必然垂直于整个已构造的子空间。

例题 1:Gram-Schmidt 正交化

题目:$\mathbb{R}^3$(标准内积)中,给定基 $\alpha_1=(1,1,1)^T,\ \alpha_2=(1,0,1)^T,\ \alpha_3=(0,1,1)^T$,用 Gram-Schmidt 正交化构造一组标准正交基。

目标:掌握正交化过程的每一步——投影、减法、归一化。

  1. $\beta_1 = \alpha_1$$\beta_1 = (1,1,1)^T$
  2. 计算 $\beta_2$$\beta_2 = \alpha_2 - \dfrac{\langle\alpha_2,\beta_1\rangle}{\langle\beta_1,\beta_1\rangle}\beta_1$

    先算内积:$\langle\alpha_2,\beta_1\rangle = 1\cdot1 + 0\cdot1 + 1\cdot1 = 2$$\langle\beta_1,\beta_1\rangle = 1^2+1^2+1^2 = 3$

    投影系数 $= \frac{2}{3}$。因此 $\beta_2 = (1,0,1)^T - \frac{2}{3}(1,1,1)^T = \left(\frac{1}{3}, -\frac{2}{3}, \frac{1}{3}\right)^T$

  3. 计算 $\beta_3$$\beta_3 = \alpha_3 - \dfrac{\langle\alpha_3,\beta_1\rangle}{\langle\beta_1,\beta_1\rangle}\beta_1 - \dfrac{\langle\alpha_3,\beta_2\rangle}{\langle\beta_2,\beta_2\rangle}\beta_2$

    $\langle\alpha_3,\beta_1\rangle = 0+1+1 = 2$,投影系数对 $\beta_1$$\frac{2}{3}$

    $\langle\alpha_3,\beta_2\rangle = 0\cdot\frac{1}{3} + 1\cdot(-\frac{2}{3}) + 1\cdot\frac{1}{3} = -\frac{1}{3}$$\langle\beta_2,\beta_2\rangle = (\frac{1}{3})^2 + (-\frac{2}{3})^2 + (\frac{1}{3})^2 = \frac{6}{9} = \frac{2}{3}$,投影系数对 $\beta_2$$-\frac{1}{2}$

    因此 $\beta_3 = (0,1,1)^T - \frac{2}{3}(1,1,1)^T - (-\frac{1}{2})(\frac{1}{3},-\frac{2}{3},\frac{1}{3})^T$

  4. 整理 $\beta_3$

    $\beta_3 = (0,1,1) - (\frac{2}{3},\frac{2}{3},\frac{2}{3}) + (\frac{1}{6},-\frac{1}{3},\frac{1}{6}) = (-\frac{1}{2},0,\frac{1}{2})$

  5. 归一化

    $\gamma_1 = \dfrac{\beta_1}{\|\beta_1\|} = \frac{1}{\sqrt{3}}(1,1,1)^T$

    $\gamma_2 = \dfrac{\beta_2}{\|\beta_2\|} = \frac{\sqrt{3}}{\sqrt{2}}(\frac{1}{3},-\frac{2}{3},\frac{1}{3})^T = (\frac{1}{\sqrt{6}},-\frac{2}{\sqrt{6}},\frac{1}{\sqrt{6}})^T$

    $\gamma_3 = \dfrac{\beta_3}{\|\beta_3\|} = \frac{(\frac{1}{2},0,-\frac{1}{2})}{\frac{1}{\sqrt{2}}} = (-\frac{1}{\sqrt{2}},0,\frac{1}{\sqrt{2}})^T$

答案:标准正交基为 $\left\{ \frac{1}{\sqrt{3}}(1,1,1)^T,\ \frac{1}{\sqrt{6}}(1,-2,1)^T,\ \frac{1}{\sqrt{2}}(-1,0,1)^T \right\}$

验证:任意两个不同的 $\gamma_i$ 做内积得到 0,每个 $\gamma_i$ 与自己内积得到 1。这是标准正交基的双重检验。

QR 分解:若将 $\alpha_1,\dots,\alpha_n$ 排成矩阵 $A$ 的列,Gram-Schmidt 正交化等价于求出 $A = QR$,其中 $Q$ 的列是标准正交向量,$R$ 是上三角矩阵记录投影系数。

Part 4 · 正交变换与正交矩阵
保持内积不变的线性变换

在欧氏空间中,有一类特殊的线性变换——正交变换——它不改变向量的长度和夹角。直观上这就是"旋转"和"镜面反射"。

PDF正交变换p.12

pdf/线性代数/6.1.pdf · p.12

打开原文

正交变换

$T: V\to V$ 是欧氏空间 $V$ 上的线性变换。若对 $\forall \alpha,\beta \in V$,有

$$\langle T(\alpha), T(\beta)\rangle = \langle\alpha,\beta\rangle$$

则称 $T$正交变换

正交变换的等价条件(以下三个等价):

  • 保持内积:$\langle T(\alpha), T(\beta)\rangle = \langle\alpha,\beta\rangle$
  • 保持长度:$\|T(\alpha)\| = \|\alpha\|$
  • 在标准正交基下的矩阵是正交矩阵

正交矩阵

$n$ 阶实方阵 $Q$ 称为正交矩阵,若满足

$$Q^TQ = QQ^T = I\quad\Longleftrightarrow\quad Q^{-1} = Q^T$$

等价性质:

  • $Q$ 的行(列)向量构成 $\mathbb{R}^n$ 的一组标准正交基
  • $\det(Q) = \pm 1$$\det = +1$ 是旋转变换,$\det = -1$ 含反射成分)
  • $Q$ 的特征值的模长均为 1

正交变换化二次型为标准形的核心定理

主轴定理(正交对角化)

$A$$n$ 阶实对称矩阵,则存在正交矩阵 $Q$,使得

$$Q^TAQ = \operatorname{diag}(\lambda_1, \lambda_2, \dots, \lambda_n)$$

其中 $\lambda_1,\dots,\lambda_n$$A$ 的特征值(按任意顺序排列)。$Q$ 的列是对应于这些特征值的标准正交特征向量。

这个定理的意义:任何实对称矩阵都可以通过正交变换对角化。对二次型来说,$X = QY$$f(X) = X^TAX$ 化为

$$f = \lambda_1 y_1^2 + \lambda_2 y_2^2 + \cdots + \lambda_n y_n^2$$

这就是二次型的标准形(也是规范形,因为特征值符号已经唯一确定)。

Part 5 · 二次型的标准化——配方法与正交变换法
两种路径,同一答案

化二次型为标准形有两种主流方法:配方法可以手工计算、过程直观;正交变换法理论优美、几何意义明确。

PDF二次型标准化方法p.15

pdf/线性代数/6.1.pdf · p.15

打开原文

配方法(Lagrange 配方法)

适用场景:低阶($n\le 3$)二次型,手工计算。

步骤

  • 若存在平方项 $a_{ii} \neq 0$:将所有含 $x_i$ 的项合并,配方,剩余部分不含 $x_i$
  • 若完全没有平方项(所有 $a_{ii}=0$):先做一次可逆线性替换 $x_i = y_i + y_j,\ x_j = y_i - y_j$ 制造平方项
  • 递归进行直到只剩平方项

局限性:变换矩阵 $P$ 不是正交矩阵(只是可逆矩阵),因此几何意义不如正交变换法清晰。配方法得到的是合同变换而非相似变换

正交变换法

步骤

  • 写出二次型的对称矩阵 $A$
  • $A$ 的特征值 $\lambda_1,\dots,\lambda_n$
  • 对每个特征值,求对应的特征向量
  • 对重特征值的特征向量做 Schmidt 正交化
  • 将所有标准正交特征向量排成正交矩阵 $Q$
  • $X = QY$ 即得标准形 $\sum \lambda_i y_i^2$

例题 2:用正交变换化二次型为标准形

题目:将二次型 $f(x_1,x_2,x_3) = 2x_1^2 + 5x_2^2 + 5x_3^2 + 4x_1x_2 - 4x_1x_3 - 8x_2x_3$ 通过正交变换化为标准形。

目标:掌握正交变换法的完整六步流程。

  1. 写出矩阵$A = \begin{pmatrix}2 & 2 & -2 \\ 2 & 5 & -4 \\ -2 & -4 & 5\end{pmatrix}$
  2. 求特征值:解 $\det(A - \lambda I) = 0$
    $$\det\begin{pmatrix}2-\lambda & 2 & -2 \\ 2 & 5-\lambda & -4 \\ -2 & -4 & 5-\lambda\end{pmatrix} = 0$$

    展开得 $(2-\lambda)(\lambda^2 - 10\lambda + 9) + 2(2\lambda-8) - 2(-2\lambda+8) = 0$,化简得 $-\lambda^3 + 12\lambda^2 - 21\lambda + 10 = 0$,即 $\lambda^3 - 12\lambda^2 + 21\lambda - 10 = 0$

    因式分解:$(\lambda-1)(\lambda^2 - 11\lambda + 10) = (\lambda-1)^2(\lambda-10) = 0$

  3. 特征值$\lambda_1 = 10$(单根),$\lambda_2 = \lambda_3 = 1$(二重根)。
  4. $\lambda_1 = 10$ 的特征向量:解 $(A-10I)\mathbf{v} = 0$

    $\begin{pmatrix}-8 & 2 & -2 \\ 2 & -5 & -4 \\ -2 & -4 & -5\end{pmatrix}\mathbf{v} = 0$,得 $\mathbf{v}_1 = (1, -2, 2)^T$。归一化:$\mathbf{q}_1 = \frac{1}{3}(1, -2, 2)^T$

  5. $\lambda = 1$ 的特征向量:解 $(A-I)\mathbf{v} = 0$

    $\begin{pmatrix}1 & 2 & -2 \\ 2 & 4 & -4 \\ -2 & -4 & 4\end{pmatrix}\mathbf{v} = 0$,即 $x_1 + 2x_2 - 2x_3 = 0$。取正交于 $\mathbf{v}_1$ 的两个解:

    $\mathbf{v}_2 = (-2, 1, 0)^T$$\mathbf{v}_3 = (2, 0, 1)^T$(代入验证满足方程且与 $\mathbf{v}_1$ 正交)。

    $\mathbf{v}_2,\mathbf{v}_3$ 做 Schmidt 正交化:取 $\beta_2 = \mathbf{v}_2$$\beta_3 = \mathbf{v}_3 - \frac{\langle\mathbf{v}_3,\beta_2\rangle}{\langle\beta_2,\beta_2\rangle}\beta_2$

    $\langle\mathbf{v}_3,\beta_2\rangle = 2(-2)+0\cdot1+1\cdot0 = -4$$\langle\beta_2,\beta_2\rangle = 4+1+0=5$

    $\beta_3 = (2,0,1) - \frac{-4}{5}(-2,1,0) = (2,0,1) - (\frac{8}{5},-\frac{4}{5},0) = (\frac{2}{5},\frac{4}{5},1) = \frac{1}{5}(2,4,5)$

    $\mathbf{q}_2 = \frac{(-2,1,0)}{\sqrt{5}}$$\mathbf{q}_3 = \frac{(2,4,5)}{3\sqrt{5}}$

  6. 构造正交矩阵 $Q$ 得标准形

    $Q = \begin{pmatrix}\frac{1}{3} & -\frac{2}{\sqrt{5}} & \frac{2}{3\sqrt{5}} \\ -\frac{2}{3} & \frac{1}{\sqrt{5}} & \frac{4}{3\sqrt{5}} \\ \frac{2}{3} & 0 & \frac{5}{3\sqrt{5}}\end{pmatrix}$

    $X = QY$,得标准形 $f = 10y_1^2 + y_2^2 + y_3^2$

答案:标准形为 $10y_1^2 + y_2^2 + y_3^2$,正交变换矩阵为 $Q$

易错点:重特征值对应的特征向量必须相互正交——不是任意解都行,需要在解空间中选取正交对。正交化后用 $\det(Q) = \pm 1$ 验算一次。

惯性定理:无论用什么方法化标准形,标准形中正系数的个数 $p$ 和负系数的个数 $q$ 是唯一确定的。$(p,q)$ 称为二次型的惯性指数。正系数个数 $p$ 也称为正惯性指数,负系数个数 $q$负惯性指数。规范形写作

$$f = y_1^2 + \cdots + y_p^2 - y_{p+1}^2 - \cdots - y_{p+q}^2$$

$r = p + q$ 是矩阵 $A$ 的秩,也是二次型中非零平方项的项数。

PDF惯性定理p.18

pdf/线性代数/6.1.pdf · p.18

打开原文

Part 6 · 正定二次型与正定矩阵
所有 $X \neq 0$ 都让 $X^TAX > 0$

正定性的研究来源于一个简单问题:什么时候二次型 $f(X)$ 的最小值是正的?

PDF正定二次型p.1

pdf/线性代数/6.2.pdf · p.1

打开原文

正定二次型 / 正定矩阵

$f(X) = X^TAX$ 是实二次型($A$ 为对称矩阵)。若对 $\forall X \neq 0$,恒有

$$f(X) = X^TAX > 0$$

则称 $f$正定二次型$A$正定矩阵

判定方法一览表

方法正定条件负定条件半正定条件
特征值法所有 $\lambda_i > 0$所有 $\lambda_i < 0$所有 $\lambda_i \ge 0$
顺序主子式法所有 $\Delta_k > 0$$\Delta_1 < 0,\ \Delta_2 > 0,\ \Delta_3 < 0,\ \dots$所有 $\Delta_k \ge 0$(不充分,需结合特征值)
配方法标准形平方项全正标准形平方项全负标准形所有平方项非负

其中 $\Delta_k$$A$$k$ 阶顺序主子式:

$$\Delta_k = \det\begin{pmatrix}a_{11} & \cdots & a_{1k} \\ \vdots & \ddots & \vdots \\ a_{k1} & \cdots & a_{kk}\end{pmatrix}$$

例题 3:判断正定性

题目:判断矩阵 $A = \begin{pmatrix}5 & 2 & -1 \\ 2 & 2 & 1 \\ -1 & 1 & 3\end{pmatrix}$ 是否正定。

目标:掌握顺序主子式法和特征值法两种判断途径。

法一:顺序主子式法

  1. 一阶主子式$\Delta_1 = 5 > 0$
  2. 二阶主子式$\Delta_2 = \det\begin{pmatrix}5 & 2 \\ 2 & 2\end{pmatrix} = 5\cdot2 - 2\cdot2 = 10 - 4 = 6 > 0$
  3. 三阶主子式$\Delta_3 = \det\begin{pmatrix}5 & 2 & -1 \\ 2 & 2 & 1 \\ -1 & 1 & 3\end{pmatrix}$

    按第一行展开:$5\cdot\det\begin{pmatrix}2 & 1 \\ 1 & 3\end{pmatrix} - 2\cdot\det\begin{pmatrix}2 & 1 \\ -1 & 3\end{pmatrix} + (-1)\cdot\det\begin{pmatrix}2 & 2 \\ -1 & 1\end{pmatrix}$

    $= 5(6-1) - 2(6+1) - 1(2+2) = 5\cdot5 - 2\cdot7 - 4 = 25 - 14 - 4 = 7 > 0$

法二:特征值法

$\det(A-\lambda I)=0$$\det\begin{pmatrix}5-\lambda & 2 & -1 \\ 2 & 2-\lambda & 1 \\ -1 & 1 & 3-\lambda\end{pmatrix} = 0$。 计算得 $-\lambda^3 + 10\lambda^2 - 20\lambda + 7 = 0$,即 $\lambda^3 - 10\lambda^2 + 20\lambda - 7 = 0$

尝试 $\lambda=1$$1 - 10 + 20 - 7 = 4 \neq 0$$\lambda=7$$343 - 490 + 140 - 7 = -14 \neq 0$

说明三个特征值都不是简单整数根。但由顺序主子式法已能判定——三个主子式都正,故而 $A$ 是正定矩阵。这体现了顺序主子式法的优势:避免解三次方程。

答案:$A$ 是正定矩阵。

技巧:判定正定性总是先用顺序主子式法——这是最简单、最可靠的手工方法。特征值法可用于机器计算或理论分析。

正定矩阵的重要性质

  • 正定矩阵的所有主对角线元素 $a_{ii} > 0$(必要条件,非充分)
  • 正定矩阵的所有特征值 $> 0$
  • 正定矩阵的行列式 $> 0$
  • $A$ 正定,则存在唯一的下三角矩阵 $L$(对角元正)使得 $A = LL^T$(Cholesky 分解)
  • 正定矩阵 $+$ 正定矩阵 $=$ 正定矩阵;正定矩阵乘正数 $=$ 正定矩阵

例题:实对称正定矩阵的矩阵分解

$A \in \mathbb{R}^{3\times3}$ 是实对称正定矩阵,下列哪一种分解一定存在且唯一?

  • LU 分解$A = LU$$L$ 为单位下三角矩阵)
  • QR 分解$A = QR$
  • 奇异值分解(SVD)$A = U\Sigma V^T$
  • Cholesky 分解$A = LL^T$$L$ 为下三角、对角元为正)

分析:

  • 选项 A(LU):对任意非奇异矩阵的 LU 分解不一定存在;若高斯消元过程中出现零主元,需要行置换(PA = LU)。对 SPD 矩阵,高斯消元主元均正,因此 LU 分解存在;但唯一性需指定 $L$ 为单位下三角,此时唯一。
  • 选项 B(QR):QR 分解存在且不唯一。Gram-Schmidt 正交化得到的 $Q$ 不唯一(取决于正交化顺序),Householder 反射也涉及符号选择。
  • 选项 C(SVD):SVD 存在但不唯一。$U, V^T$ 均可乘以反射矩阵($\det = -1$)得到新的分解。
  • 选项 D(Cholesky):对 SPD 矩阵,存在唯一的下三角矩阵 $L$(对角元为正)使得 $A = LL^T$。这是正定矩阵的特征性质,也是数值计算中求解正定线性方程组最常用的方法。

答案:D——Cholesky 分解是实对称正定矩阵存在且唯一的分解。

负定、半正定、不定

  • 负定$X^TAX < 0$ 对所有 $X \neq 0$ 成立 $\iff$ 所有特征值 $< 0$ $\iff$ 奇数阶顺序主子式 $< 0$、偶数阶 $> 0$
  • 半正定$X^TAX \ge 0$ 对所有 $X \neq 0$ 成立 $\iff$ 所有特征值 $\ge 0$
  • 不定$X^TAX$ 可正可负 $\iff$ 特征值有正有负
PDF正定矩阵的判定p.3

pdf/线性代数/6.2.pdf · p.3

打开原文

Part 7 · Cholesky 分解
正定矩阵的专属分解——$A = LL^T$

第二章学过 LU 分解——对任意方阵在高斯消元时不选主元的一种分解。Cholesky 分解是 LU 分解在对称正定矩阵上的特化版本,利用对称性大幅降低计算量和存储需求。

Cholesky 分解定理

$A \in \mathbb{R}^{n \times n}$ 是实对称正定矩阵,则存在唯一的下三角矩阵 $L$(对角元均为正数),使得

$$A = LL^T$$

其中 $L$ 的对角元 $> 0$,且分解唯一。

为什么唯一?

对称正定 $\Rightarrow$ 所有顺序主子式 $\Delta_k > 0$ $\Rightarrow$ 高斯消元不选主元时 LU 分解唯一(第二章定理)。设 $A = \tilde{L}U$,其中 $\tilde{L}$ 为单位下三角,$U$ 为上三角。由对称性 $A = A^T = U^T \tilde{L}^T$,唯一性定理保证 $\tilde{L} = U^T$,记 $U = D\tilde{U}$$D = \operatorname{diag}(u_{11},\dots,u_{nn})$$\tilde{U}$ 为单位上三角),则 $A = \tilde{L}D\tilde{U}$。由对称性 $\tilde{L} = \tilde{U}^T$,于是 $A = \tilde{U}^TD\tilde{U}$。正定性保证 $D > 0$(对角元为正),令 $L = \tilde{U}^T\sqrt{D}$$\sqrt{D}$ 逐元开方),则 $A = LL^T$

计算公式(逐行推导)

$L = (\ell_{ij})$,由 $A = LL^T$ 按行展开:

  • 对角元:$\ell_{ii} = \sqrt{a_{ii} - \sum_{k=1}^{i-1} \ell_{ik}^2}$
  • 下三角元:$\ell_{ij} = \dfrac{a_{ij} - \sum_{k=1}^{j-1} \ell_{ik}\ell_{jk}}{\ell_{jj}}$,其中 $i > j$

每一行需要先计算对角元 $\ell_{jj}$,再算该行左侧所有 $\ell_{ij}$。计算量约为 $\frac{1}{6}n^3$,是 LU 分解的一半。

例题:$2 \times 2$ 矩阵的 Cholesky 分解

题目:$A = \begin{pmatrix}4 & 2 \\ 2 & 5\end{pmatrix}$,求 Cholesky 分解 $A = LL^T$

  1. $\ell_{11} = \sqrt{a_{11}} = \sqrt{4} = 2$
  2. $\ell_{21} = \dfrac{a_{21}}{\ell_{11}} = \dfrac{2}{2} = 1$
  3. $\ell_{22} = \sqrt{a_{22} - \ell_{21}^2} = \sqrt{5 - 1} = \sqrt{4} = 2$

验证:$LL^T = \begin{pmatrix}2 & 0 \\ 1 & 2\end{pmatrix}\begin{pmatrix}2 & 1 \\ 0 & 2\end{pmatrix} = \begin{pmatrix}4 & 2 \\ 2 & 5\end{pmatrix} = A$

Cholesky 分解 vs LU 分解

对比项LU 分解Cholesky 分解
适用条件所有顺序主子式 $\Delta_k \neq 0$对称正定($\Delta_k > 0$
唯一性需指定 $L$ 为单位下三角时唯一唯一($L$ 对角元强制为正)
计算量$\frac{1}{3}n^3$$\frac{1}{6}n^3$(减半)
存储优势需存 $L$$U$ 两个矩阵只需存 $L$$U = L^T$ 是冗余信息)
数值稳定性一般,需选主元增强天然稳定(无需选主元)

核心应用

  • 求解正定线性方程组$Ax = b \Rightarrow LL^Tx = b \Rightarrow Ly = b,\ L^Tx = y$,两步回代,$O(n^2)$
  • 计算行列式$\det(A) = \prod_{i=1}^n \ell_{ii}^2$
  • 多元正态分布:协方差矩阵 $\Sigma = LL^T$$L$ 用于随机采样(Cholesky 采样)
  • 最小二乘法:法方程 $A^TAx = A^Tb$ 的求解
Part 8 · 二次曲面分类
三维空间中二次方程的几何形状

三维空间中的二次曲面定义为 $(x,y,z)$ 满足的二次方程:

PDF二次曲面定义p.1

pdf/线性代数/6.3.pdf · p.1

打开原文

$$F(x,y,z) = a_{11}x^2 + a_{22}y^2 + a_{33}z^2 + 2a_{12}xy + 2a_{13}xz + 2a_{23}yz + b_1x + b_2y + b_3z + c = 0$$

写成矩阵形式:$X^TAX + B^TX + c = 0$,其中 $A$ 是对称矩阵。通过正交变换(旋转移除交叉项)和平移(移除一次项),任何二次曲面都可以化为标准位置。

九种标准二次曲面

类型标准方程几何特征图示特征
椭球面$\dfrac{x^2}{a^2} + \dfrac{y^2}{b^2} + \dfrac{z^2}{c^2} = 1$有界、封闭、三轴对称$a=b=c$ 时退化为球面
单叶双曲面$\dfrac{x^2}{a^2} + \dfrac{y^2}{b^2} - \dfrac{z^2}{c^2} = 1$无界、连通、一个负号$z$ 轴旋转
双叶双曲面$\dfrac{x^2}{a^2} + \dfrac{y^2}{b^2} - \dfrac{z^2}{c^2} = -1$无界、两叶、两个负号只有 $|z| \ge c$ 时有图形
椭圆抛物面$z = \dfrac{x^2}{a^2} + \dfrac{y^2}{b^2}$无界、开口向上、碗状$a=b$ 时是旋转抛物面
双曲抛物面$z = \dfrac{x^2}{a^2} - \dfrac{y^2}{b^2}$马鞍面、无界$z=0$ 处为两条相交直线
椭圆柱面$\dfrac{x^2}{a^2} + \dfrac{y^2}{b^2} = 1$母线平行 $z$$z$ 无约束
双曲柱面$\dfrac{x^2}{a^2} - \dfrac{y^2}{b^2} = 1$母线平行 $z$双曲线沿 $z$ 轴平移
抛物柱面$y = ax^2$母线平行 $z$抛物线沿 $z$ 轴平移
锥面$\dfrac{x^2}{a^2} + \dfrac{y^2}{b^2} - \dfrac{z^2}{c^2} = 0$过原点的锥形$z$ 方向展开

二次曲面分类判据

设二次型矩阵 $A$ 的特征值为 $\lambda_1,\lambda_2,\lambda_3$(已符号分类),结合一次项的有无:

  • 三个同号 → 椭球面(等号右侧为正)或虚椭球面(无实点)或(零解)
  • 两个同号、一个异号 → 单叶双曲面(右侧正)或双叶双曲面(右侧负)或锥面(右侧零)
  • 两个同号、一个为 0,且有一次项 → 椭圆/双曲抛物面

实际中通过正交变换化二次项为标准形后,再配方平移移除一次项,即可确定曲面类型。

PDF二次曲面分类方法p.5

pdf/线性代数/6.3.pdf · p.5

打开原文

实际操作步骤

  1. 分离二次项和一次项:$F(x,y,z) = X^TAX + B^TX + c$
  2. $A$ 做正交对角化:$Q^TAQ = \operatorname{diag}(\lambda_1,\lambda_2,\lambda_3)$
  3. 作变换 $X = QY$ 消去交叉项,一次项变为 $B^TQY$
  4. 对每个变量配方(完全平方),平移坐标系消去一次项
  5. 根据最终方程形式对照标准表分类
内容连接
二次型在课程中的桥梁角色
← 特征值与特征向量(5.1—5.4 节)
正交对角化依赖实对称矩阵谱定理
主轴定理:任何实对称矩阵可正交对角化,其列向量构成标准正交基。这是二次型标准化的理论基石。
PDF实对称矩阵的对角化p.1

pdf/线性代数/5.3.pdf · p.1

打开原文

→ 正定矩阵与 Cholesky 分解
正定性在数值分析中的核心地位
正定矩阵的 Cholesky 分解 $A=LL^T$ 是求解对称正定线性方程组的最快数值方法,也是最小二乘法的基础。
→ 二次曲面(6.3 节)
二次型的几何应用
三维空间中用正交变换判别二次曲面类型,是主轴定理的在几何中的直接应用。
PDF二次曲面p.1

pdf/线性代数/6.3.pdf · p.1

打开原文

→ 多元微积分
Hessian 矩阵与极值判定
$f(x_1,\dots,x_n)$ 在驻点处 $Hessian$ 是否正定决定该点是局部极小值还是极大值。这正是正定矩阵在多元函数上的应用。

复习速查

概念定义 / 公式关键点
二次型的矩阵$f(X) = X^TAX$$A$ 对称$a_{ij} = a_{ji}$,交叉项系数平分
欧氏空间线性空间 $+$ 内积对称性 + 线性性 + 正定性
Schmidt 正交化$\beta_k = \alpha_k - \sum_{i<k}\frac{\langle\alpha_k,\beta_i\rangle}{\langle\beta_i,\beta_i\rangle}\beta_i$投影减法的迭代过程
正交矩阵 $Q$$Q^TQ = I \iff Q^{-1} = Q^T$$\det Q = \pm 1$,列向量标准正交
正交变换标准形$Q^TAQ = \operatorname{diag}(\lambda_1,\dots,\lambda_n)$特征值按大小排列,对应特征向量排成 $Q$
惯性指数 $(p,q)$$f = y_1^2+\cdots+y_p^2 - y_{p+1}^2 - \cdots - y_{p+q}^2$与标准化方法无关,唯一确定
正定矩阵$X^TAX > 0$ 对所有 $X \neq 0$等价于所有特征值 $> 0$,所有顺序主子式 $> 0$
主轴定理实对称矩阵 $\xrightarrow{\text{正交矩阵}}$ 对角矩阵$Q$ 的标准正交特征向量即为主轴方向
Cholesky 分解$A = LL^T$(正定矩阵)$L$ 是下三角、对角元为正

参考来源