ESC
输入关键词搜索文章
目录

矩阵及其运算

线性代数 · 第一章
从数的排列到线性变换——矩阵是线性代数的运算语言
Part 0 · 学习目标
矩阵:线性代数的运算语言

矩阵是线性代数中最基础、最核心的工具,也是贯穿整个课程的最重要概念。本章不是让你记住一个个孤立的运算规则——而是在建立一整套代数语言:有了矩阵,线性方程组可以写成 $A\mathbf{x} = \mathbf{b}$;线性变换可以用矩阵乘法表示;逆矩阵则让"解方程"变成了"两边同时左乘 $A^{-1}$"这种简洁操作。

本章覆盖矩阵概念与类型、矩阵的线性运算(加法与数乘)、矩阵乘法、矩阵转置、高斯消元法与初等变换、初等矩阵、逆矩阵的概念与性质、用行初等变换求逆矩阵、分块矩阵及其运算等内容。

前置知识回顾

  • 数的四则运算:加、减、乘、除的运算律(交换律、结合律、分配律)——矩阵的运算规则是这些的推广,但有重要区别。
  • 线性方程组:二元一次方程组的系数排列天然形成一个"数表",这就是矩阵的起源,见
    PDF二元一次方程组的系数排列天然形成一个\p.2
    正在渲染 PDF 第 2 页…
    二元一次方程组的系数排列天然形成一个\(PDF 第 2 页) · 打开原文
  • 排列与下标$a_{ij}$ 表示第 $i$ 行第 $j$ 列的元素,习惯先行后列。
Part 1 · 背景与动机
为什么需要矩阵?

考虑一个航空公司在 A、B、C、D 四座城市间的航线图。从 A 到 B 有航班、从 B 到 A 也有航班、从 A 到 C 有航班……

如果把这个关系用一个表格表示,把城市编号为行和列,有航班记作 1、无航班记作 0,得到:

$$\begin{pmatrix} 0 & 1 & 1 & 0 \\ 1 & 0 & 1 & 0 \\ 1 & 0 & 0 & 1 \\ 0 & 1 & 0 & 0 \end{pmatrix}$$

这个"数表"就是一个 矩阵。其核心价值是:把实际问题转化为数字排列,然后用代数运算分析。矩阵就是这样一个桥梁——实际问题 $\to$ 数学 $\to$ 易分析、易计算。

再看一个例子:一个服装厂生产三种款式的上衣和两种款式的裤子,每月产量用表格记录,每件的成本和售价也分别用表格记录。要计算总收入和总成本,就需要把产量表和价格表进行某种"乘法"运算。这些直观的实际需求,最终催生了矩阵这一数学对象和它配套的运算规则体系。

类似地,一个 $m$ 个方程、$n$ 个未知数的线性方程组:

$$\begin{cases} a_{11}x_1 + a_{12}x_2 + \cdots + a_{1n}x_n = b_1 \\ a_{21}x_1 + a_{22}x_2 + \cdots + a_{2n}x_n = b_2 \\ \qquad\qquad \vdots \\ a_{m1}x_1 + a_{m2}x_2 + \cdots + a_{mn}x_n = b_m \end{cases}$$

它的系数可以写成一个 系数矩阵 $A_{m\times n}$ 以及 未知数向量 $\mathbf{x}$常数项向量 $\mathbf{b}$

$$A = \begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \end{pmatrix},\quad \mathbf{x} = \begin{pmatrix}x_1 \\ x_2 \\ \vdots \\ x_n\end{pmatrix},\quad \mathbf{b} = \begin{pmatrix}b_1 \\ b_2 \\ \vdots \\ b_m\end{pmatrix}$$

再补上常数项就是 增广矩阵 $\overline{A} = (A \mid \mathbf{b})$。用矩阵写,整个方程组简化为一个式子 $A\mathbf{x} = \mathbf{b}$——这就是矩阵的第一个伟大贡献:把复杂系统用简洁的符号表示出来,使得我们可以用代数工具系统地分析和求解。

PDF航班图例引出矩阵p.3
正在渲染 PDF 第 3 页…
航班图例引出矩阵(PDF 第 3 页) · 打开原文

矩阵概念
矩阵概念的引入 · 电子科技大学线性代数课件
Part 2 · 矩阵的基本概念
从数表到代数对象

矩阵的定义

$m\times n$ 个数 $a_{ij}$$i=1,\dots,m;\, j=1,\dots,n$)排成的 $m$$n$ 列的矩形数表,称为 $m\times n$ 矩阵,记作 $A_{m\times n}$$A = (a_{ij})_{m\times n}$

$$A_{m\times n} = \begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \end{pmatrix}$$

常见特殊矩阵

类型定义形式或例子
零矩阵 $O$所有元素均为 0$\begin{pmatrix}0&0\\0&0\end{pmatrix}$
方阵$m = n$,称为 $n$ 阶矩阵行数 = 列数
行矩阵$m = 1$$(a_1\;a_2\;\cdots\;a_n)$
列矩阵(列向量)$n = 1$$\begin{pmatrix}a_1\\a_2\\\vdots\\a_m\end{pmatrix}$
对角矩阵非对角元全为 0$\operatorname{diag}(d_1,d_2,\dots,d_n)$
单位矩阵 $I$对角元全为 1 的对角矩阵$I_n$$E_n$
上三角矩阵$i > j \Rightarrow a_{ij}=0$主对角线以下全为零
下三角矩阵$i < j \Rightarrow a_{ij}=0$主对角线以上全为零

同型矩阵与矩阵相等:若 $A=(a_{ij})$, $B=(b_{ij})$ 同为 $m\times n$ 矩阵,且对应位置元素相等 ($a_{ij}=b_{ij}$),则称 $A=B$

PDF矩阵的概念——方阵、对角阵、单位阵 · p.5–6p.5–6
正在渲染 PDF 第 5 页…
正在渲染 PDF 第 6 页…
矩阵的概念——方阵、对角阵、单位阵(PDF p.5–6) · 打开原文

Part 3 · 矩阵的线性运算
加法和数乘——最朴素的运算

加法

$A=(a_{ij}), B=(b_{ij})$ 均为 $m\times n$ 矩阵,则 $A+B = (a_{ij}+b_{ij})$。即对应位置元素分别相加。

注意:只有同型矩阵才能相加。

数乘

$\lambda$ 是实数(或复数),$A=(a_{ij})$$m\times n$ 矩阵,则 $\lambda A = (\lambda a_{ij})$。即每个元素乘以 $\lambda$

负矩阵与减法$-A = (-1)\cdot A$$A - B = A + (-B)$

八条运算律(矩阵线性空间的结构)

加法交换律 $A+B = B+A$;加法结合律 $(A+B)+C = A+(B+C)$;存在零矩阵 $O$ 使 $A+O=A$;存在负矩阵 $(-A)$ 使 $A+(-A)=O$

数乘结合律 $\lambda(\mu A) = (\lambda\mu)A$;数乘分配律 $(\lambda+\mu)A = \lambda A+\mu A$;数乘对矩阵加法分配律 $\lambda(A+B)=\lambda A+\lambda B$$1\cdot A = A$

这八条性质与向量的线性运算规则一致——矩阵在加法和数乘下构成一个线性空间,这是后续"矩阵空间"概念的雏形。

例题 1:矩阵的线性运算

题目:$A = \begin{pmatrix}1 & 2 & -1 \\ 0 & 3 & 2\end{pmatrix}$$B = \begin{pmatrix}2 & -1 & 0 \\ 1 & 1 & 2\end{pmatrix}$,求 $A+B$$2A - 3B$

目标:掌握同型矩阵的加减法和数乘,注意对应位置运算。

  1. $A+B$:对应元素相加:

    $A+B = \begin{pmatrix}1+2 & 2+(-1) & -1+0 \\ 0+1 & 3+1 & 2+2\end{pmatrix} = \begin{pmatrix}3 & 1 & -1 \\ 1 & 4 & 4\end{pmatrix}$

  2. $2A - 3B$:先数乘、再相减:

    $2A = \begin{pmatrix}2 & 4 & -2 \\ 0 & 6 & 4\end{pmatrix}$$3B = \begin{pmatrix}6 & -3 & 0 \\ 3 & 3 & 6\end{pmatrix}$

    $2A - 3B = \begin{pmatrix}2-6 & 4-(-3) & -2-0 \\ 0-3 & 6-3 & 4-6\end{pmatrix} = \begin{pmatrix}-4 & 7 & -2 \\ -3 & 3 & -2\end{pmatrix}$

答案:$A+B = \begin{pmatrix}3 & 1 & -1 \\ 1 & 4 & 4\end{pmatrix}$, $2A-3B = \begin{pmatrix}-4 & 7 & -2 \\ -3 & 3 & -2\end{pmatrix}$

易错点:不同型的矩阵不能相加减。计算 $2A-3B$ 时,先分别数乘再统一做减法,避免符号错误。

PDF矩阵线性运算的八条性质p.10

pdf/线性代数/1.1.pdf · p.10

打开原文

Part 4 · 矩阵的乘法
矩阵乘法——线性代数最核心的运算

为什么需要矩阵乘法?

回看例2:某电子集团生产三种彩电型号,第一季度各 40、20、30 万台,第二季度各 30、10、50 万台,每万台的利润分别是 400、300、500 万元。要计算第一、二季度的总利润——这就是"行向量 $\times$ 列向量"的雏形。

矩阵乘法的定义

$A$$m\times s$ 矩阵,$B$$s\times n$ 矩阵,则乘积 $C = AB$$m\times n$ 矩阵,其第 $i$ 行第 $j$ 列元素为:

$$\displaystyle c_{ij} = \sum_{k=1}^{s} a_{ik}b_{kj}$$

几何理解:$c_{ij}$ 等于 $A$ 的第 $i$ 行与 $B$ 的第 $j$ 列对应元素相乘再求和——行与列的"内积"。

关键约束:$A$ 的列数必须等于 $B$ 的行数,否则乘法无定义。

这个定义初看似乎复杂,但它不是凭空而来。回顾前面彩电利润的例子:设产量矩阵 $Q$$2\times 3$(两季度、三种型号),利润向量 $\mathbf{p}$$3\times 1$(单位利润),总利润就是 $Q\mathbf{p}$——正是矩阵乘法。这里的核心思想是:变量的复合对应着矩阵的乘法,这一思想在后续学习线性变换的复合时会再次出现。

从四个视角理解矩阵乘法

  • 逐元素视角:对 $(i,j)$ 位置,取第 $i$ 行与第 $j$ 列点乘——这是标准算法。
  • 列视角$C$ 的第 $j$ 列 = $A$ 乘以 $B$ 的第 $j$ 列,即 $C_{:,j} = A\cdot B_{:,j}$。每列是 $A$ 的列向量的线性组合。
  • 行视角$C$ 的第 $i$ 行 = $A$ 的第 $i$ 行乘以 $B$,每行是 $B$ 的行向量的线性组合。
  • $\times$行视角$AB = \sum_{k=1}^{s} A_{:,k}\cdot B_{k,:}$——把 $A$ 的每列与 $B$ 的每行外积相加。

矩阵乘法的运算律

性质公式说明
结合律$(AB)C = A(BC)$乘法次序不变时,先乘哪两个都可以
左分配律$A(B+C) = AB+AC$前提是各乘法可定义
右分配律$(B+C)A = BA+CA$注意左右顺序不可交换
数乘结合$\lambda(AB) = (\lambda A)B = A(\lambda B)$数乘可自由移动
矩阵乘法不满足交换律:一般情况下 $AB \neq BA$。例如 $A = \begin{pmatrix}0&1\\0&0\end{pmatrix}$, $B = \begin{pmatrix}0&0\\1&0\end{pmatrix}$,则 $AB = \begin{pmatrix}1&0\\0&0\end{pmatrix}$$BA = \begin{pmatrix}0&0\\0&1\end{pmatrix}$$AB \neq BA$。同样地,矩阵乘法也不满足消去律:$AB = AC$ 不能推出 $B=C$

方阵的幂与多项式

$n$ 阶方阵 $A$,定义 $A^k = \underbrace{A\cdot A\cdots A}_{k\text{ 个}}$$A^0 = I$(单位阵)。由此可以定义方阵的多项式:

$$f(A) = a_m A^m + a_{m-1}A^{m-1} + \cdots + a_1 A + a_0 I$$

注意:$AB \neq BA$ 导致 $(A+B)^2 \neq A^2 + 2AB + B^2$ 一般情况下——只有在 $AB=BA$ 时(称 $A,B$ 可交换)二项式定理才成立。

线性方程组的矩阵形式

矩阵乘法最直接的应用:将 $m$ 个方程、$n$ 个未知数的线性方程组写作 $A\mathbf{x} = \mathbf{b}$,其中 $\mathbf{x} = (x_1,\dots,x_n)^T$ 是列向量,$\mathbf{b}$ 是常数项列向量。这个记号贯穿整个线性代数课程。

例题 2:矩阵乘法的计算——三个视角验证

题目:$A = \begin{pmatrix}1 & 2 \\ 3 & 4\end{pmatrix}$$B = \begin{pmatrix}0 & 1 \\ 1 & 0\end{pmatrix}$。求 $AB$$BA$,并验证 $AB \neq BA$

目标:掌握矩阵乘法的行$\times$列规则,理解交换律失效。

  1. 计算 $AB$(逐元素法):

    $c_{11}=1\cdot0+2\cdot1=2$$c_{12}=1\cdot1+2\cdot0=1$

    $c_{21}=3\cdot0+4\cdot1=4$$c_{22}=3\cdot1+4\cdot0=3$

    所以 $AB = \begin{pmatrix}2 & 1 \\ 4 & 3\end{pmatrix}$

  2. 计算 $BA$

    $d_{11}=0\cdot1+1\cdot3=3$$d_{12}=0\cdot2+1\cdot4=4$

    $d_{21}=1\cdot1+0\cdot3=1$$d_{22}=1\cdot2+0\cdot4=2$

    所以 $BA = \begin{pmatrix}3 & 4 \\ 1 & 2\end{pmatrix}$

  3. 显然 $AB \neq BA$

答案:$AB = \begin{pmatrix}2&1\\4&3\end{pmatrix}$$BA = \begin{pmatrix}3&4\\1&2\end{pmatrix}$$AB\neq BA$$B$ 是交换两行的置换矩阵,左乘 $B$ 交换了 $A$ 的行,右乘 $B$ 交换了 $A$ 的列——两个操作完全不同。

易错点:初学者常误以为矩形乘法可以交换顺序。规则:左矩阵的列数必须等于右矩阵的行数。维度不匹配时乘法无定义。

PDF矩阵乘法定义与例3-6p.11

pdf/线性代数/1.1.pdf · p.11

打开原文

例题:方阵多项式的化简——发现周期性

题目:$A = \begin{pmatrix} -11 & 4 \\ -30 & 11 \end{pmatrix}$,则 $(A + E)(E - A + A^2 - A^3 + A^4 - A^5 + A^6) = \text{?}$$E$ 为单位矩阵)

分析:第二个因子是矩阵多项式,直接展开计算 $A^2 \sim A^6$ 再代入太繁琐。突破口是先算低次幂,寻找周期性

解:

第一步,计算 $A^2$

$$A^2 = \begin{pmatrix} -11 & 4 \\ -30 & 11 \end{pmatrix}\begin{pmatrix} -11 & 4 \\ -30 & 11 \end{pmatrix} = \begin{pmatrix} 121-120 & -44+44 \\ 330-330 & -120+121 \end{pmatrix} = \begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix} = E$$

$A^2 = E$!由此推出幂的周期为 2

  • $A^3 = A \cdot A^2 = AE = A$
  • $A^4 = (A^2)^2 = E^2 = E$
  • $A^5 = A^4 \cdot A = EA = A$
  • $A^6 = (A^2)^3 = E^3 = E$

第二步,化简第二个因子:

$$E - A + A^2 - A^3 + A^4 - A^5 + A^6 = E - A + E - A + E - A + E = 4E - 3A$$

第三步,计算最终结果:

$$(A+E)(4E-3A) = 4A - 3A^2 + 4E - 3A = 4A - 3E + 4E - 3A = A + E$$
$$A + E = \begin{pmatrix} -11 & 4 \\ -30 & 11 \end{pmatrix} + \begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix} = \begin{pmatrix} -10 & 4 \\ -30 & 12 \end{pmatrix}$$
方法要点:遇到矩阵多项式,先算低次幂找周期——$A^2 = E$(周期 2)或 $A^3 = E$(周期 3)是最常见的出题模式。周期一旦确定,高次幂全部归约,多项式急剧简化。

矩阵转置

转置的定义与性质

$A$ 的转置 $A^T$:将 $A$ 的行与列互换得到的矩阵。若 $A=(a_{ij})_{m\times n}$,则 $A^T = (a_{ji})_{n\times m}$

转置的运算性质:

  • $(A^T)^T = A$
  • $(A+B)^T = A^T+B^T$
  • $(kA)^T = kA^T$
  • $(AB)^T = B^T A^T$(乘积的转置 = 反向转置相乘——反转律,这是最常见考察点)
  • $(A_1A_2\cdots A_k)^T = A_k^T\cdots A_2^T A_1^T$

对称矩阵与反对称矩阵

对称矩阵$A^T = A$。此时 $a_{ij} = a_{ji}$,矩阵关于主对角线对称。例如 $\begin{pmatrix}1 & 2 \\ 2 & 3\end{pmatrix}$

反对称矩阵$A^T = -A$。此时 $a_{ij} = -a_{ji}$,主对角线元素全为零。例如 $\begin{pmatrix}0 & 2 \\ -2 & 0\end{pmatrix}$

一个重要事实:任何方阵都可唯一地分解为对称矩阵与反对称矩阵之和$A = \dfrac{A+A^T}{2} + \dfrac{A-A^T}{2}$

PDF对称矩阵与反对称矩阵p.30

pdf/线性代数/1.1.pdf · p.30

打开原文

高斯消元法
高斯消元法与初等变换 · 电子科技大学线性代数课件
Part 5 · 高斯消元法与初等变换
从解方程组到矩阵操作——消元法的代数化

背景问题

线性方程组 $A\mathbf{x} = \mathbf{b}$ 的解是否存在?如果存在,是唯一解还是无穷多解?高斯消元法就是回答这个问题的标准算法。

在中学阶段,我们就知道解线性方程组可以通过三种操作:交换两个方程的位置、用一个非零数乘一个方程、把一个方程的倍数加到另一个方程上。这三种操作不会改变方程组的解——称为同解变换。当我们不再关注方程本身,而只关心系数和常数时,这些操作就抽象为矩阵的初等行变换。

高斯消元法的历史可以追溯到两千多年前的中国数学典籍《九章算术》。其中就已经用"遍乘直除"的方法求解线性方程组,其思想本质上就是今天的高斯消元法。这说明消元法的思想是跨越时代的——它是最自然、最系统的线性方程组求解方法。

三类同解变换的矩阵对应

  1. 交换两个方程的位置(对应矩阵的两行互换
  2. 用一个非零数乘某个方程(对应矩阵的某行乘以非零常数
  3. 把一个方程的适当倍数加到另一个方程上(对应矩阵的某行的倍数加到另一行

矩阵的初等行变换

对矩阵 $A$ 实施以下三种操作,称为初等行变换

  1. 对换:交换第 $i$ 行与第 $j$ 行,记作 $r_i \leftrightarrow r_j$
  2. 倍乘:用非零常数 $k$ 乘第 $i$ 行所有元素,记作 $r_i \times k$
  3. 倍加:将第 $i$ 行的 $k$ 倍加到第 $j$ 行,记作 $r_j + k\cdot r_i$

类似地可定义初等列变换

高斯消元法的步骤:

  1. 写出增广矩阵 $\overline{A} = (A \mid \mathbf{b})$
  2. 用初等行变换将 $\overline{A}$ 化为行阶梯形矩阵
  3. 进一步化为行简化阶梯形(行最简形)。
  4. 根据行阶梯形判断解的情况:无解、唯一解、无穷多解。

高斯消元法本质上是将一个一般的线性系统逐步简化为一个等价的、更容易求解的系统。每一步都保持解集不变,最终的行阶梯形揭示了系统的全部结构信息。

为什么这个方法叫"消元"?因为我们的目标就是逐次消去未知数:先用第一个方程消去其他方程中的 $x_1$,再用第二个方程消去后续方程中的 $x_2$,以此类推。这个过程在增广矩阵中表现为逐列制造零元素,最终形成阶梯状的结构。

行阶梯形与解的关系判断表

行阶梯形形式非零行数 $r$解的情况
出现 $[0\cdots0\mid d]$$d\neq0$无解(矛盾方程)
$r = n$(未知数个数)$r=n$唯一解
$r < n$$r < n$无穷多解,$n-r$ 个自由未知量

对于齐次方程组 $A\mathbf{x}=0$,不存在"无解"情况(至少有一个零解)。
$r=n$ 时只有零解;$r < n$ 时有非零解。

PDF高斯消元法与初等变换p.1

pdf/线性代数/1.2.pdf · p.1

打开原文

初等矩阵

初等矩阵的定义与作用

对单位矩阵 $I_m$ 实施一次初等变换得到的矩阵,称为初等矩阵。初等矩阵分为三类:

  • 对换矩阵 $E_{ij}$:交换 $I$ 的第 $i,j$ 行(或列)。$E_{ij}^{-1} = E_{ij}$(自逆)。
  • 倍乘矩阵 $E_i(k)$$I$ 的第 $i$ 行(或列)乘以 $k\neq0$$E_i(k)^{-1} = E_i(1/k)$
  • 倍加矩阵 $E_{ij}(k)$$I$ 的第 $j$ 行加上第 $i$ 行的 $k$ 倍(或第 $i$ 列加上第 $j$ 列的 $k$ 倍)。$E_{ij}(k)^{-1} = E_{ij}(-k)$

核心关系:对 $A$ 实施初等行变换 $\iff$ 左乘对应的初等矩阵;实施初等列变换 $\iff$ 右乘对应的初等矩阵。

例题:初等列变换与右乘初等矩阵

题目:$A$ 是 3 阶方阵,将 $A$ 的第 1 列与第 2 列交换得到 $B$,再把 $B$ 的第 2 列加到第 3 列得到 $C$。求满足 $AQ = C$ 的可逆矩阵 $Q$

分析:列变换对应右乘初等矩阵。两步操作按序右乘:$C = A \cdot E_1 \cdot E_2 = AQ$

解:

  1. 交换第 1、2 列:$B = AE_1$,其中 $E_1 = \begin{pmatrix} 0 & 1 & 0 \\ 1 & 0 & 0 \\ 0 & 0 & 1 \end{pmatrix}$(对换单位矩阵第 1、2 列)
  2. 第 2 列加到第 3 列:$C = BE_2$,其中 $E_2 = \begin{pmatrix} 1 & 0 & 0 \\ 0 & 1 & 1 \\ 0 & 0 & 1 \end{pmatrix}$(单位矩阵 $(3,2)$ 位置加 1)
  3. 合并:$Q = E_1 E_2 = \begin{pmatrix} 0 & 1 & 0 \\ 1 & 0 & 0 \\ 0 & 0 & 1 \end{pmatrix}\begin{pmatrix} 1 & 0 & 0 \\ 0 & 1 & 1 \\ 0 & 0 & 1 \end{pmatrix} = \begin{pmatrix} 0 & 1 & 1 \\ 1 & 0 & 0 \\ 0 & 0 & 1 \end{pmatrix}$

答案:$Q = \begin{pmatrix} 0 & 1 & 1 \\ 1 & 0 & 0 \\ 0 & 0 & 1 \end{pmatrix}$,选 C。

关键规则:行变换 = 左乘(从左边施加),列变换 = 右乘(从右边施加)。多步操作按执行顺序依次相乘。初学者常混淆左右——记忆口诀:行左列右。

例题 3:用高斯消元法解方程组

题目:解线性方程组 $\begin{cases} x_1 + x_2 + x_3 = 1 \\ x_1 + 2x_2 - 5x_3 = 2 \\ 2x_1 + 3x_2 - 4x_3 = 5 \end{cases}$

目标:掌握用增广矩阵行变换求解的完整流程,学会判断无解情况。

  1. 写出增广矩阵$\overline{A} = \begin{pmatrix}1 & 1 & 1 & 1 \\ 1 & 2 & -5 & 2 \\ 2 & 3 & -4 & 5\end{pmatrix}$
  2. 消元$r_2 - r_1$$r_3 - 2r_1$$\begin{pmatrix}1 & 1 & 1 & 1 \\ 0 & 1 & -6 & 1 \\ 0 & 1 & -6 & 3\end{pmatrix}$
  3. 去零$r_3 - r_2$$\begin{pmatrix}1 & 1 & 1 & 1 \\ 0 & 1 & -6 & 1 \\ 0 & 0 & 0 & 2\end{pmatrix}$
  4. 判断:第三行对应方程 $0x_1+0x_2+0x_3 = 2$,即 $0=2$,矛盾。

答案:方程组无解。

易错点:行阶梯形中若出现 $[0\cdots0\mid d]$$d\neq0$),直接判定无解,不必继续化简。初学者常试图继续求解,浪费精力。

PDF例5——无解判定p.10

pdf/线性代数/1.2.pdf · p.10

打开原文

逆矩阵
逆矩阵的概念与性质 · 电子科技大学线性代数课件
Part 6 · 逆矩阵
矩阵的"除法"——逆矩阵与可逆性

为什么需要逆矩阵?

实数运算中,已知 $ax=b$$a\neq0$,两边乘 $a^{-1}$ 得到 $x=a^{-1}b$。这个操作如此自然,以至于我们很少思考它的意义:$a^{-1}$$a$ 在乘法下的"逆元",它把 $a$ 的作用抵消掉。矩阵世界也是如此:如果 $A$ 是某个线性变换的矩阵表示,那么 $A^{-1}$ 就是逆变换的矩阵。在解线性方程组时,若 $A$ 可逆,解 $A\mathbf{x}=\mathbf{b}$ 可以写成 $\mathbf{x}=A^{-1}\mathbf{b}$。逆矩阵就是矩阵的"除法"——在矩阵运算中扮演 $1/a$ 的角色。

逆矩阵的定义

$A$$n$ 阶方阵。若存在 $n$ 阶矩阵 $B$ 使得 $AB = BA = I$,则称 $A$ 可逆,$B$$A$ 的逆矩阵,记作 $B = A^{-1}$

定理:若 $A$ 可逆,则逆矩阵唯一(反证法:设 $B,C$ 都是逆,则 $B = BI = B(AC) = (BA)C = IC = C$)。

基本性质

#性质条件
1$(A^{-1})^{-1} = A$$A$ 可逆
2$(\lambda A)^{-1} = \frac{1}{\lambda}A^{-1}$$\lambda \neq 0$
3$(AB)^{-1} = B^{-1}A^{-1}$$A,B$ 均可逆(反转律:乘积的逆=反向的逆乘积)
4$(A^T)^{-1} = (A^{-1})^T$$A$ 可逆

可逆性的等价条件

可逆性判据定理

对于 $n$ 阶矩阵 $A$,以下命题等价:

  1. $A$ 可逆;
  2. $A\mathbf{x}=0$ 只有零解;
  3. $A$ 与单位矩阵 $I$ 行等价(可通过初等行变换化为 $I$);
  4. $A$ 可表为有限个初等矩阵的乘积;
  5. $\det(A) \neq 0$(行列式判据,与第二章衔接)。

用行初等变换求逆矩阵

这是最实用、最常用的求逆方法,也是数值线性代数中求解逆矩阵的标准算法。原理:若 $A$ 可逆,则存在初等矩阵 $E_1,\dots,E_k$ 使得 $E_k\cdots E_1 A = I$。如果我们在 $A$ 右边并排放一个单位矩阵 $I$,则同样的行变换序列会作用于 $I$ 得到 $E_k\cdots E_1 I = A^{-1}$。实际操作:

构造 $n\times 2n$ 矩阵 $(A \mid I)$,对整矩阵做行初等变换,当左边变为 $I$ 时,右边就是 $A^{-1}$

这个方法的计算复杂度为 $O(n^3)$,与高斯消元法相同。虽然理论上可以用逆矩阵定义来检验,但对于 $n\ge 4$ 手工计算就很繁琐。在实际工程中,逆矩阵通常由计算机(如 MATLAB、NumPy)通过 LU 分解等数值方法计算。

例题 4:用行初等变换求逆矩阵

题目:$A = \begin{pmatrix}1 & 2 & -1 \\ 0 & 1 & 2 \\ 0 & 0 & 1\end{pmatrix}$,求 $A^{-1}$

目标:掌握 $[A\mid I]$ 法求逆,理解初等行变换的精髓。

  1. 构造$(A \mid I) = \begin{pmatrix}1 & 2 & -1 & 1 & 0 & 0 \\ 0 & 1 & 2 & 0 & 1 & 0 \\ 0 & 0 & 1 & 0 & 0 & 1\end{pmatrix}$
  2. 消去第3列上方$r_2 - 2r_3$$r_1 + r_3$

    $\begin{pmatrix}1 & 2 & 0 & 1 & 0 & 1 \\ 0 & 1 & 0 & 0 & 1 & -2 \\ 0 & 0 & 1 & 0 & 0 & 1\end{pmatrix}$

  3. 消去第2列上方$r_1 - 2r_2$

    $\begin{pmatrix}1 & 0 & 0 & 1 & -2 & 5 \\ 0 & 1 & 0 & 0 & 1 & -2 \\ 0 & 0 & 1 & 0 & 0 & 1\end{pmatrix}$

  4. 提取右边$A^{-1} = \begin{pmatrix}1 & -2 & 5 \\ 0 & 1 & -2 \\ 0 & 0 & 1\end{pmatrix}$

验证$AA^{-1} = \begin{pmatrix}1&2&-1\\0&1&2\\0&0&1\end{pmatrix}\begin{pmatrix}1&-2&5\\0&1&-2\\0&0&1\end{pmatrix} = \begin{pmatrix}1&0&0\\0&1&0\\0&0&1\end{pmatrix} = I$

易错点:只做变换,不能混用列变换。若某列无法化为 $I$(出现全零行),则 $A$ 不可逆。变换顺序:从最后一列开始逐步向上消元(回代)效率最高。

矩阵方程

利用逆矩阵可以求解三种基本形式的矩阵方程,每种对应不同的左右乘关系:

这里的关键是区分方程中未知矩阵 $X$ 是乘在 $A$ 的左边还是右边。由于矩阵乘法不满足交换律,左右的位置不能互换。一个常见技巧是:$X$$A$ 的哪一侧,$A^{-1}$ 就乘在哪一侧。如果两侧都有矩阵,则左边的逆左乘、右边的逆右乘。

  • $AX = B$$A$ 可逆)$\Rightarrow X = A^{-1}B$
  • $XA = B$$A$ 可逆)$\Rightarrow X = BA^{-1}$
  • $AXB = C$$A,B$ 可逆)$\Rightarrow X = A^{-1}CB^{-1}$

注意左右乘的顺序不能错——因为矩阵乘法不交换。

PDF逆矩阵的概念与性质p.1

pdf/线性代数/1.3.pdf · p.1

打开原文

分块矩阵
分块矩阵运算 · 电子科技大学线性代数课件
Part 7 · 分块矩阵
大矩阵的结构化——从整体到局部

为什么需要分块矩阵?

处理大型矩阵时,把所有元素一目了然地写出来往往不现实,也没必要。例如一个 $100\times 100$ 的矩阵,如果它恰好是块对角结构(只有对角线上的几个小块非零),我们完全可以把它当作几个小矩阵来处理。分块矩阵的核心思想是:把大问题分解为小问题,把高阶运算化为低阶运算,这既简化了计算,也有助于理论推导——很多定理的证明就是通过巧妙分块后利用低阶结论来完成的。

分块矩阵的定义

用若干条纵线和横线将矩阵分成若干个小矩阵,每个小矩阵称为一个子块(或子矩阵)。以子块为元素构成的矩阵称为分块矩阵

例:$A = \begin{pmatrix}1 & 0 & 0 & 2 \\ 0 & 1 & 0 & 3 \\ 0 & 0 & 1 & 4 \\ 0 & 0 & 0 & 5\end{pmatrix}$ 可分为 $A = \begin{pmatrix}I_3 & \mathbf{a} \\ 0 & 5\end{pmatrix}$,其中 $\mathbf{a} = (2,3,4)^T$

分块矩阵的运算

加法:要求分块方式相同,对应子块相加。

数乘:每个子块乘以该数。

乘法:设 $A$ 按列分块的方式与 $B$ 按行分块的方式一致,则 $C=AB$ 的子块 $C_{ij} = \sum_k A_{ik}B_{kj}$。这本质上是把子块当作"元素"做乘法——但注意子块乘法是有顺序的(矩阵乘法不交换)。

块对角矩阵:形如 $A = \begin{pmatrix}A_1 & 0 \\ 0 & A_2\end{pmatrix}$ 的矩阵,其中 $A_1,A_2$ 是方阵。其逆矩阵为 $A^{-1} = \begin{pmatrix}A_1^{-1} & 0 \\ 0 & A_2^{-1}\end{pmatrix}$

分块技巧在实际应用中很重要:当矩阵具有特殊结构(稀疏、带状、块对角)时,正确分块可以将一个大型问题分解为几个小型子问题。例如在有限元分析中,整体刚度矩阵通常由局部刚度矩阵装配而成,利用分块技巧可以大幅降低计算量。分块矩阵的转置和逆需要特别小心——不仅要对子块整体做转置,每个子块内部也要做转置。

分块矩阵的转置与逆

转置:将子块视为"元素"做转置后,每个子块再做一次通常的转置

例如 $\begin{pmatrix}A & B \\ C & D\end{pmatrix}^T = \begin{pmatrix}A^T & C^T \\ B^T & D^T\end{pmatrix}$(先整体转置交换 $B$$C$ 的位置,再分别转置各子块)。

分块求逆公式(以 $2\times2$ 分块为例):若 $A = \begin{pmatrix}A_{11} & A_{12} \\ A_{21} & A_{22}\end{pmatrix}$$A_{11}$ 可逆,则

$$A^{-1} = \begin{pmatrix}A_{11}^{-1} + A_{11}^{-1}A_{12}S^{-1}A_{21}A_{11}^{-1} & -A_{11}^{-1}A_{12}S^{-1} \\ -S^{-1}A_{21}A_{11}^{-1} & S^{-1}\end{pmatrix}$$

其中 $S = A_{22} - A_{21}A_{11}^{-1}A_{12}$(称为 $A_{11}$ 的 Schur 补)。这个公式在数值线性代数中极为重要。

例题 5:用分块法求矩阵的逆

题目:$A = \begin{pmatrix}1 & 0 & 2 \\ 0 & 1 & 3 \\ 0 & 0 & 5\end{pmatrix}$,用分块法求 $A^{-1}$

目标:掌握块对角矩阵的求逆技巧,理解分块简化计算的作用。

  1. 分块:将 $A$ 分为 $A = \begin{pmatrix}I_2 & B \\ 0 & 5\end{pmatrix}$,其中 $I_2 = \begin{pmatrix}1&0\\0&1\end{pmatrix}$$B = \begin{pmatrix}2\\3\end{pmatrix}$
  2. 利用公式:块对角(上三角块)的逆为 $\begin{pmatrix}I_2^{-1} & -I_2^{-1}B\cdot5^{-1} \\ 0 & 5^{-1}\end{pmatrix} = \begin{pmatrix}I_2 & -B/5 \\ 0 & 1/5\end{pmatrix}$
  3. 代入$A^{-1} = \begin{pmatrix}1 & 0 & -2/5 \\ 0 & 1 & -3/5 \\ 0 & 0 & 1/5\end{pmatrix}$

验证$AA^{-1} = \begin{pmatrix}1&0&2\\0&1&3\\0&0&5\end{pmatrix}\begin{pmatrix}1&0&-2/5\\0&1&-3/5\\0&0&1/5\end{pmatrix} = I_3$

易错点:分块乘法中,子块乘法的顺序不能随意交换。$B\cdot S^{-1}$$S^{-1}\cdot B$ 是不同的——注意左乘右乘的区分。

PDF分块矩阵p.1

pdf/线性代数/1.4.pdf · p.1

打开原文

Part 8 · 与后续章节的关系
矩阵运算在课程中的连接图
→ 行列式(第二章)
$n$ 阶方阵 $\to$ 标量 $\det(A)$
行列式是判断 $A$ 可逆的充要条件($\det(A)\neq0$)。$\det(AB)=\det(A)\det(B)$ 连接了矩阵乘法和行列式的乘法公式。
→ 向量空间(第三章)
矩阵的列空间与零空间
矩阵 $A$ 的列向量张成的空间定义了 $A\mathbf{x}=\mathbf{b}$ 的解存在性。高斯消元法求出的自由未知量对应零空间的维数。
→ 线性方程组(第四章)
矩阵的秩——解结构的最终判据
矩阵的秩 = 行阶梯形中非零行的个数。秩决定了 $A\mathbf{x}=\mathbf{b}$ 解的个数与形式,见
PDF解的结构判定p.20

pdf/线性代数/1.2.pdf · p.20

打开原文

→ 特征值(第五章)
方阵 $\to$ 特征多项式 $\det(A-\lambda I)$
求特征值就是解 $\det(A-\lambda I)=0$,这需要行列式知识。若 $A$ 可逆,则所有特征值非零。
→ 二次型(第六章)
对称矩阵与合同变换
二次型 $f(\mathbf{x})=\mathbf{x}^T A \mathbf{x}$ 中的 $A$ 必为对称矩阵。通过矩阵的转置和乘法把一个二次型标准化——这是分块矩阵求逆的典型应用场景。
→ 数值分析 / 工程
矩阵分解:LU、QR、SVD
高斯消元法等价于 $A=LU$(LU 分解),初等矩阵提供了理论基础。分块求逆公式是 Schur 补的雏形,用于大规模稀疏矩阵的高效计算。

复习速查

概念定义 / 公式关键点
矩阵定义$m\times n$ 矩形数表 $A=(a_{ij})$先行后列,$a_{ij}$
矩阵加法对应位置相加必须同型
矩阵数乘每个元素乘 $\lambda$$\lambda A = (\lambda a_{ij})$
矩阵乘法$c_{ij}=\sum_k a_{ik}b_{kj}$$A$ 列数 = $B$ 行数,不交换
转置 $A^T$行列互换$(AB)^T = B^TA^T$
对称矩阵$A^T = A$$a_{ij}=a_{ji}$
初等行变换对换、倍乘、倍加高斯消元的三种操作
初等矩阵$I$ 做一次初等变换左乘=行变换,右乘=列变换
逆矩阵 $A^{-1}$$AA^{-1}=I$唯一,$(AB)^{-1}=B^{-1}A^{-1}$
求逆法 (1)$(A \mid I) \xrightarrow{\text{行变换}} (I \mid A^{-1})$最实用,只做行变换
分块乘法$C_{ij}=\sum_k A_{ik}B_{kj}$分块一致,子块顺序不变
块对角逆$\begin{pmatrix}A&0\\0&B\end{pmatrix}^{-1}=\begin{pmatrix}A^{-1}&0\\0&B^{-1}\end{pmatrix}$各子块分别求逆

参考来源