矩阵及其运算
矩阵是线性代数中最基础、最核心的工具,也是贯穿整个课程的最重要概念。本章不是让你记住一个个孤立的运算规则——而是在建立一整套代数语言:有了矩阵,线性方程组可以写成 $A\mathbf{x} = \mathbf{b}$;线性变换可以用矩阵乘法表示;逆矩阵则让"解方程"变成了"两边同时左乘 $A^{-1}$"这种简洁操作。
本章覆盖矩阵概念与类型、矩阵的线性运算(加法与数乘)、矩阵乘法、矩阵转置、高斯消元法与初等变换、初等矩阵、逆矩阵的概念与性质、用行初等变换求逆矩阵、分块矩阵及其运算等内容。
前置知识回顾
- 数的四则运算:加、减、乘、除的运算律(交换律、结合律、分配律)——矩阵的运算规则是这些的推广,但有重要区别。
- 线性方程组:二元一次方程组的系数排列天然形成一个"数表",这就是矩阵的起源,见
。PDF二元一次方程组的系数排列天然形成一个\p.2正在渲染 PDF 第 2 页…二元一次方程组的系数排列天然形成一个\(PDF 第 2 页) · 打开原文 - 排列与下标:$a_{ij}$ 表示第 $i$ 行第 $j$ 列的元素,习惯先行后列。
考虑一个航空公司在 A、B、C、D 四座城市间的航线图。从 A 到 B 有航班、从 B 到 A 也有航班、从 A 到 C 有航班……
如果把这个关系用一个表格表示,把城市编号为行和列,有航班记作 1、无航班记作 0,得到:
这个"数表"就是一个 矩阵。其核心价值是:把实际问题转化为数字排列,然后用代数运算分析。矩阵就是这样一个桥梁——实际问题 $\to$ 数学 $\to$ 易分析、易计算。
再看一个例子:一个服装厂生产三种款式的上衣和两种款式的裤子,每月产量用表格记录,每件的成本和售价也分别用表格记录。要计算总收入和总成本,就需要把产量表和价格表进行某种"乘法"运算。这些直观的实际需求,最终催生了矩阵这一数学对象和它配套的运算规则体系。
类似地,一个 $m$ 个方程、$n$ 个未知数的线性方程组:
它的系数可以写成一个 系数矩阵 $A_{m\times n}$ 以及 未知数向量 $\mathbf{x}$ 和 常数项向量 $\mathbf{b}$:
再补上常数项就是 增广矩阵 $\overline{A} = (A \mid \mathbf{b})$。用矩阵写,整个方程组简化为一个式子 $A\mathbf{x} = \mathbf{b}$——这就是矩阵的第一个伟大贡献:把复杂系统用简洁的符号表示出来,使得我们可以用代数工具系统地分析和求解。

矩阵的定义
由 $m\times n$ 个数 $a_{ij}$($i=1,\dots,m;\, j=1,\dots,n$)排成的 $m$ 行 $n$ 列的矩形数表,称为 $m\times n$ 矩阵,记作 $A_{m\times n}$ 或 $A = (a_{ij})_{m\times n}$。
常见特殊矩阵
| 类型 | 定义 | 形式或例子 |
|---|---|---|
| 零矩阵 $O$ | 所有元素均为 0 | $\begin{pmatrix}0&0\\0&0\end{pmatrix}$ |
| 方阵 | $m = n$,称为 $n$ 阶矩阵 | 行数 = 列数 |
| 行矩阵 | $m = 1$ | $(a_1\;a_2\;\cdots\;a_n)$ |
| 列矩阵(列向量) | $n = 1$ | $\begin{pmatrix}a_1\\a_2\\\vdots\\a_m\end{pmatrix}$ |
| 对角矩阵 | 非对角元全为 0 | $\operatorname{diag}(d_1,d_2,\dots,d_n)$ |
| 单位矩阵 $I$ | 对角元全为 1 的对角矩阵 | $I_n$ 或 $E_n$ |
| 上三角矩阵 | $i > j \Rightarrow a_{ij}=0$ | 主对角线以下全为零 |
| 下三角矩阵 | $i < j \Rightarrow a_{ij}=0$ | 主对角线以上全为零 |
同型矩阵与矩阵相等:若 $A=(a_{ij})$, $B=(b_{ij})$ 同为 $m\times n$ 矩阵,且对应位置元素相等 ($a_{ij}=b_{ij}$),则称 $A=B$。
加法
设 $A=(a_{ij}), B=(b_{ij})$ 均为 $m\times n$ 矩阵,则 $A+B = (a_{ij}+b_{ij})$。即对应位置元素分别相加。
注意:只有同型矩阵才能相加。
数乘
设 $\lambda$ 是实数(或复数),$A=(a_{ij})$ 是 $m\times n$ 矩阵,则 $\lambda A = (\lambda a_{ij})$。即每个元素乘以 $\lambda$。
负矩阵与减法:$-A = (-1)\cdot A$,$A - B = A + (-B)$。
八条运算律(矩阵线性空间的结构):
加法交换律 $A+B = B+A$;加法结合律 $(A+B)+C = A+(B+C)$;存在零矩阵 $O$ 使 $A+O=A$;存在负矩阵 $(-A)$ 使 $A+(-A)=O$。
数乘结合律 $\lambda(\mu A) = (\lambda\mu)A$;数乘分配律 $(\lambda+\mu)A = \lambda A+\mu A$;数乘对矩阵加法分配律 $\lambda(A+B)=\lambda A+\lambda B$;$1\cdot A = A$。
这八条性质与向量的线性运算规则一致——矩阵在加法和数乘下构成一个线性空间,这是后续"矩阵空间"概念的雏形。
例题 1:矩阵的线性运算
题目:设 $A = \begin{pmatrix}1 & 2 & -1 \\ 0 & 3 & 2\end{pmatrix}$,$B = \begin{pmatrix}2 & -1 & 0 \\ 1 & 1 & 2\end{pmatrix}$,求 $A+B$ 和 $2A - 3B$。
目标:掌握同型矩阵的加减法和数乘,注意对应位置运算。
- $A+B$:对应元素相加:
$A+B = \begin{pmatrix}1+2 & 2+(-1) & -1+0 \\ 0+1 & 3+1 & 2+2\end{pmatrix} = \begin{pmatrix}3 & 1 & -1 \\ 1 & 4 & 4\end{pmatrix}$。
- $2A - 3B$:先数乘、再相减:
$2A = \begin{pmatrix}2 & 4 & -2 \\ 0 & 6 & 4\end{pmatrix}$,$3B = \begin{pmatrix}6 & -3 & 0 \\ 3 & 3 & 6\end{pmatrix}$。
$2A - 3B = \begin{pmatrix}2-6 & 4-(-3) & -2-0 \\ 0-3 & 6-3 & 4-6\end{pmatrix} = \begin{pmatrix}-4 & 7 & -2 \\ -3 & 3 & -2\end{pmatrix}$。
答案:$A+B = \begin{pmatrix}3 & 1 & -1 \\ 1 & 4 & 4\end{pmatrix}$, $2A-3B = \begin{pmatrix}-4 & 7 & -2 \\ -3 & 3 & -2\end{pmatrix}$。
为什么需要矩阵乘法?
回看例2:某电子集团生产三种彩电型号,第一季度各 40、20、30 万台,第二季度各 30、10、50 万台,每万台的利润分别是 400、300、500 万元。要计算第一、二季度的总利润——这就是"行向量 $\times$ 列向量"的雏形。
矩阵乘法的定义
设 $A$ 是 $m\times s$ 矩阵,$B$ 是 $s\times n$ 矩阵,则乘积 $C = AB$ 是 $m\times n$ 矩阵,其第 $i$ 行第 $j$ 列元素为:
几何理解:$c_{ij}$ 等于 $A$ 的第 $i$ 行与 $B$ 的第 $j$ 列对应元素相乘再求和——行与列的"内积"。
关键约束:$A$ 的列数必须等于 $B$ 的行数,否则乘法无定义。
这个定义初看似乎复杂,但它不是凭空而来。回顾前面彩电利润的例子:设产量矩阵 $Q$ 为 $2\times 3$(两季度、三种型号),利润向量 $\mathbf{p}$ 为 $3\times 1$(单位利润),总利润就是 $Q\mathbf{p}$——正是矩阵乘法。这里的核心思想是:变量的复合对应着矩阵的乘法,这一思想在后续学习线性变换的复合时会再次出现。
从四个视角理解矩阵乘法
- 逐元素视角:对 $(i,j)$ 位置,取第 $i$ 行与第 $j$ 列点乘——这是标准算法。
- 列视角:$C$ 的第 $j$ 列 = $A$ 乘以 $B$ 的第 $j$ 列,即 $C_{:,j} = A\cdot B_{:,j}$。每列是 $A$ 的列向量的线性组合。
- 行视角:$C$ 的第 $i$ 行 = $A$ 的第 $i$ 行乘以 $B$,每行是 $B$ 的行向量的线性组合。
- 列$\times$行视角:$AB = \sum_{k=1}^{s} A_{:,k}\cdot B_{k,:}$——把 $A$ 的每列与 $B$ 的每行外积相加。
矩阵乘法的运算律
| 性质 | 公式 | 说明 |
|---|---|---|
| 结合律 | $(AB)C = A(BC)$ | 乘法次序不变时,先乘哪两个都可以 |
| 左分配律 | $A(B+C) = AB+AC$ | 前提是各乘法可定义 |
| 右分配律 | $(B+C)A = BA+CA$ | 注意左右顺序不可交换 |
| 数乘结合 | $\lambda(AB) = (\lambda A)B = A(\lambda B)$ | 数乘可自由移动 |
方阵的幂与多项式
对 $n$ 阶方阵 $A$,定义 $A^k = \underbrace{A\cdot A\cdots A}_{k\text{ 个}}$,$A^0 = I$(单位阵)。由此可以定义方阵的多项式:
注意:$AB \neq BA$ 导致 $(A+B)^2 \neq A^2 + 2AB + B^2$ 一般情况下——只有在 $AB=BA$ 时(称 $A,B$ 可交换)二项式定理才成立。
线性方程组的矩阵形式
矩阵乘法最直接的应用:将 $m$ 个方程、$n$ 个未知数的线性方程组写作 $A\mathbf{x} = \mathbf{b}$,其中 $\mathbf{x} = (x_1,\dots,x_n)^T$ 是列向量,$\mathbf{b}$ 是常数项列向量。这个记号贯穿整个线性代数课程。
例题 2:矩阵乘法的计算——三个视角验证
题目:$A = \begin{pmatrix}1 & 2 \\ 3 & 4\end{pmatrix}$,$B = \begin{pmatrix}0 & 1 \\ 1 & 0\end{pmatrix}$。求 $AB$ 和 $BA$,并验证 $AB \neq BA$。
目标:掌握矩阵乘法的行$\times$列规则,理解交换律失效。
- 计算 $AB$(逐元素法):
$c_{11}=1\cdot0+2\cdot1=2$,$c_{12}=1\cdot1+2\cdot0=1$,
$c_{21}=3\cdot0+4\cdot1=4$,$c_{22}=3\cdot1+4\cdot0=3$。
所以 $AB = \begin{pmatrix}2 & 1 \\ 4 & 3\end{pmatrix}$。
- 计算 $BA$:
$d_{11}=0\cdot1+1\cdot3=3$,$d_{12}=0\cdot2+1\cdot4=4$,
$d_{21}=1\cdot1+0\cdot3=1$,$d_{22}=1\cdot2+0\cdot4=2$。
所以 $BA = \begin{pmatrix}3 & 4 \\ 1 & 2\end{pmatrix}$。
- 显然 $AB \neq BA$。
答案:$AB = \begin{pmatrix}2&1\\4&3\end{pmatrix}$,$BA = \begin{pmatrix}3&4\\1&2\end{pmatrix}$,$AB\neq BA$。$B$ 是交换两行的置换矩阵,左乘 $B$ 交换了 $A$ 的行,右乘 $B$ 交换了 $A$ 的列——两个操作完全不同。
例题:方阵多项式的化简——发现周期性
题目:设 $A = \begin{pmatrix} -11 & 4 \\ -30 & 11 \end{pmatrix}$,则 $(A + E)(E - A + A^2 - A^3 + A^4 - A^5 + A^6) = \text{?}$($E$ 为单位矩阵)
分析:第二个因子是矩阵多项式,直接展开计算 $A^2 \sim A^6$ 再代入太繁琐。突破口是先算低次幂,寻找周期性。
解:
第一步,计算 $A^2$:
$A^2 = E$!由此推出幂的周期为 2:
- $A^3 = A \cdot A^2 = AE = A$
- $A^4 = (A^2)^2 = E^2 = E$
- $A^5 = A^4 \cdot A = EA = A$
- $A^6 = (A^2)^3 = E^3 = E$
第二步,化简第二个因子:
第三步,计算最终结果:
矩阵转置
转置的定义与性质
$A$ 的转置 $A^T$:将 $A$ 的行与列互换得到的矩阵。若 $A=(a_{ij})_{m\times n}$,则 $A^T = (a_{ji})_{n\times m}$。
转置的运算性质:
- $(A^T)^T = A$
- $(A+B)^T = A^T+B^T$
- $(kA)^T = kA^T$
- $(AB)^T = B^T A^T$(乘积的转置 = 反向转置相乘——反转律,这是最常见考察点)
- $(A_1A_2\cdots A_k)^T = A_k^T\cdots A_2^T A_1^T$
对称矩阵与反对称矩阵
对称矩阵:$A^T = A$。此时 $a_{ij} = a_{ji}$,矩阵关于主对角线对称。例如 $\begin{pmatrix}1 & 2 \\ 2 & 3\end{pmatrix}$。
反对称矩阵:$A^T = -A$。此时 $a_{ij} = -a_{ji}$,主对角线元素全为零。例如 $\begin{pmatrix}0 & 2 \\ -2 & 0\end{pmatrix}$。
一个重要事实:任何方阵都可唯一地分解为对称矩阵与反对称矩阵之和:$A = \dfrac{A+A^T}{2} + \dfrac{A-A^T}{2}$。

背景问题
线性方程组 $A\mathbf{x} = \mathbf{b}$ 的解是否存在?如果存在,是唯一解还是无穷多解?高斯消元法就是回答这个问题的标准算法。
在中学阶段,我们就知道解线性方程组可以通过三种操作:交换两个方程的位置、用一个非零数乘一个方程、把一个方程的倍数加到另一个方程上。这三种操作不会改变方程组的解——称为同解变换。当我们不再关注方程本身,而只关心系数和常数时,这些操作就抽象为矩阵的初等行变换。
高斯消元法的历史可以追溯到两千多年前的中国数学典籍《九章算术》。其中就已经用"遍乘直除"的方法求解线性方程组,其思想本质上就是今天的高斯消元法。这说明消元法的思想是跨越时代的——它是最自然、最系统的线性方程组求解方法。
三类同解变换的矩阵对应:
- 交换两个方程的位置(对应矩阵的两行互换)
- 用一个非零数乘某个方程(对应矩阵的某行乘以非零常数)
- 把一个方程的适当倍数加到另一个方程上(对应矩阵的某行的倍数加到另一行)
矩阵的初等行变换
对矩阵 $A$ 实施以下三种操作,称为初等行变换:
- 对换:交换第 $i$ 行与第 $j$ 行,记作 $r_i \leftrightarrow r_j$。
- 倍乘:用非零常数 $k$ 乘第 $i$ 行所有元素,记作 $r_i \times k$。
- 倍加:将第 $i$ 行的 $k$ 倍加到第 $j$ 行,记作 $r_j + k\cdot r_i$。
类似地可定义初等列变换。
高斯消元法的步骤:
- 写出增广矩阵 $\overline{A} = (A \mid \mathbf{b})$。
- 用初等行变换将 $\overline{A}$ 化为行阶梯形矩阵。
- 进一步化为行简化阶梯形(行最简形)。
- 根据行阶梯形判断解的情况:无解、唯一解、无穷多解。
高斯消元法本质上是将一个一般的线性系统逐步简化为一个等价的、更容易求解的系统。每一步都保持解集不变,最终的行阶梯形揭示了系统的全部结构信息。
为什么这个方法叫"消元"?因为我们的目标就是逐次消去未知数:先用第一个方程消去其他方程中的 $x_1$,再用第二个方程消去后续方程中的 $x_2$,以此类推。这个过程在增广矩阵中表现为逐列制造零元素,最终形成阶梯状的结构。
行阶梯形与解的关系判断表
| 行阶梯形形式 | 非零行数 $r$ | 解的情况 |
|---|---|---|
| 出现 $[0\cdots0\mid d]$($d\neq0$) | — | 无解(矛盾方程) |
| $r = n$(未知数个数) | $r=n$ | 唯一解 |
| $r < n$ | $r < n$ | 无穷多解,$n-r$ 个自由未知量 |
对于齐次方程组 $A\mathbf{x}=0$,不存在"无解"情况(至少有一个零解)。
$r=n$ 时只有零解;$r < n$ 时有非零解。
初等矩阵
初等矩阵的定义与作用
对单位矩阵 $I_m$ 实施一次初等变换得到的矩阵,称为初等矩阵。初等矩阵分为三类:
- 对换矩阵 $E_{ij}$:交换 $I$ 的第 $i,j$ 行(或列)。$E_{ij}^{-1} = E_{ij}$(自逆)。
- 倍乘矩阵 $E_i(k)$:$I$ 的第 $i$ 行(或列)乘以 $k\neq0$。$E_i(k)^{-1} = E_i(1/k)$。
- 倍加矩阵 $E_{ij}(k)$:$I$ 的第 $j$ 行加上第 $i$ 行的 $k$ 倍(或第 $i$ 列加上第 $j$ 列的 $k$ 倍)。$E_{ij}(k)^{-1} = E_{ij}(-k)$。
核心关系:对 $A$ 实施初等行变换 $\iff$ 左乘对应的初等矩阵;实施初等列变换 $\iff$ 右乘对应的初等矩阵。
例题:初等列变换与右乘初等矩阵
题目:设 $A$ 是 3 阶方阵,将 $A$ 的第 1 列与第 2 列交换得到 $B$,再把 $B$ 的第 2 列加到第 3 列得到 $C$。求满足 $AQ = C$ 的可逆矩阵 $Q$。
分析:列变换对应右乘初等矩阵。两步操作按序右乘:$C = A \cdot E_1 \cdot E_2 = AQ$。
解:
- 交换第 1、2 列:$B = AE_1$,其中 $E_1 = \begin{pmatrix} 0 & 1 & 0 \\ 1 & 0 & 0 \\ 0 & 0 & 1 \end{pmatrix}$(对换单位矩阵第 1、2 列)
- 第 2 列加到第 3 列:$C = BE_2$,其中 $E_2 = \begin{pmatrix} 1 & 0 & 0 \\ 0 & 1 & 1 \\ 0 & 0 & 1 \end{pmatrix}$(单位矩阵 $(3,2)$ 位置加 1)
- 合并:$Q = E_1 E_2 = \begin{pmatrix} 0 & 1 & 0 \\ 1 & 0 & 0 \\ 0 & 0 & 1 \end{pmatrix}\begin{pmatrix} 1 & 0 & 0 \\ 0 & 1 & 1 \\ 0 & 0 & 1 \end{pmatrix} = \begin{pmatrix} 0 & 1 & 1 \\ 1 & 0 & 0 \\ 0 & 0 & 1 \end{pmatrix}$
答案:$Q = \begin{pmatrix} 0 & 1 & 1 \\ 1 & 0 & 0 \\ 0 & 0 & 1 \end{pmatrix}$,选 C。
例题 3:用高斯消元法解方程组
题目:解线性方程组 $\begin{cases} x_1 + x_2 + x_3 = 1 \\ x_1 + 2x_2 - 5x_3 = 2 \\ 2x_1 + 3x_2 - 4x_3 = 5 \end{cases}$
目标:掌握用增广矩阵行变换求解的完整流程,学会判断无解情况。
- 写出增广矩阵:$\overline{A} = \begin{pmatrix}1 & 1 & 1 & 1 \\ 1 & 2 & -5 & 2 \\ 2 & 3 & -4 & 5\end{pmatrix}$。
- 消元:$r_2 - r_1$,$r_3 - 2r_1$ 得 $\begin{pmatrix}1 & 1 & 1 & 1 \\ 0 & 1 & -6 & 1 \\ 0 & 1 & -6 & 3\end{pmatrix}$。
- 去零:$r_3 - r_2$ 得 $\begin{pmatrix}1 & 1 & 1 & 1 \\ 0 & 1 & -6 & 1 \\ 0 & 0 & 0 & 2\end{pmatrix}$。
- 判断:第三行对应方程 $0x_1+0x_2+0x_3 = 2$,即 $0=2$,矛盾。
答案:方程组无解。

为什么需要逆矩阵?
实数运算中,已知 $ax=b$ 且 $a\neq0$,两边乘 $a^{-1}$ 得到 $x=a^{-1}b$。这个操作如此自然,以至于我们很少思考它的意义:$a^{-1}$ 是 $a$ 在乘法下的"逆元",它把 $a$ 的作用抵消掉。矩阵世界也是如此:如果 $A$ 是某个线性变换的矩阵表示,那么 $A^{-1}$ 就是逆变换的矩阵。在解线性方程组时,若 $A$ 可逆,解 $A\mathbf{x}=\mathbf{b}$ 可以写成 $\mathbf{x}=A^{-1}\mathbf{b}$。逆矩阵就是矩阵的"除法"——在矩阵运算中扮演 $1/a$ 的角色。
逆矩阵的定义
设 $A$ 为 $n$ 阶方阵。若存在 $n$ 阶矩阵 $B$ 使得 $AB = BA = I$,则称 $A$ 可逆,$B$ 为 $A$ 的逆矩阵,记作 $B = A^{-1}$。
定理:若 $A$ 可逆,则逆矩阵唯一(反证法:设 $B,C$ 都是逆,则 $B = BI = B(AC) = (BA)C = IC = C$)。
基本性质
| # | 性质 | 条件 |
|---|---|---|
| 1 | $(A^{-1})^{-1} = A$ | $A$ 可逆 |
| 2 | $(\lambda A)^{-1} = \frac{1}{\lambda}A^{-1}$ | $\lambda \neq 0$ |
| 3 | $(AB)^{-1} = B^{-1}A^{-1}$ | $A,B$ 均可逆(反转律:乘积的逆=反向的逆乘积) |
| 4 | $(A^T)^{-1} = (A^{-1})^T$ | $A$ 可逆 |
可逆性的等价条件
可逆性判据定理
对于 $n$ 阶矩阵 $A$,以下命题等价:
- $A$ 可逆;
- $A\mathbf{x}=0$ 只有零解;
- $A$ 与单位矩阵 $I$ 行等价(可通过初等行变换化为 $I$);
- $A$ 可表为有限个初等矩阵的乘积;
- $\det(A) \neq 0$(行列式判据,与第二章衔接)。
用行初等变换求逆矩阵
这是最实用、最常用的求逆方法,也是数值线性代数中求解逆矩阵的标准算法。原理:若 $A$ 可逆,则存在初等矩阵 $E_1,\dots,E_k$ 使得 $E_k\cdots E_1 A = I$。如果我们在 $A$ 右边并排放一个单位矩阵 $I$,则同样的行变换序列会作用于 $I$ 得到 $E_k\cdots E_1 I = A^{-1}$。实际操作:
构造 $n\times 2n$ 矩阵 $(A \mid I)$,对整矩阵做行初等变换,当左边变为 $I$ 时,右边就是 $A^{-1}$。
这个方法的计算复杂度为 $O(n^3)$,与高斯消元法相同。虽然理论上可以用逆矩阵定义来检验,但对于 $n\ge 4$ 手工计算就很繁琐。在实际工程中,逆矩阵通常由计算机(如 MATLAB、NumPy)通过 LU 分解等数值方法计算。
例题 4:用行初等变换求逆矩阵
题目:$A = \begin{pmatrix}1 & 2 & -1 \\ 0 & 1 & 2 \\ 0 & 0 & 1\end{pmatrix}$,求 $A^{-1}$。
目标:掌握 $[A\mid I]$ 法求逆,理解初等行变换的精髓。
- 构造:$(A \mid I) = \begin{pmatrix}1 & 2 & -1 & 1 & 0 & 0 \\ 0 & 1 & 2 & 0 & 1 & 0 \\ 0 & 0 & 1 & 0 & 0 & 1\end{pmatrix}$。
- 消去第3列上方:$r_2 - 2r_3$,$r_1 + r_3$ 得
$\begin{pmatrix}1 & 2 & 0 & 1 & 0 & 1 \\ 0 & 1 & 0 & 0 & 1 & -2 \\ 0 & 0 & 1 & 0 & 0 & 1\end{pmatrix}$。
- 消去第2列上方:$r_1 - 2r_2$ 得
$\begin{pmatrix}1 & 0 & 0 & 1 & -2 & 5 \\ 0 & 1 & 0 & 0 & 1 & -2 \\ 0 & 0 & 1 & 0 & 0 & 1\end{pmatrix}$。
- 提取右边:$A^{-1} = \begin{pmatrix}1 & -2 & 5 \\ 0 & 1 & -2 \\ 0 & 0 & 1\end{pmatrix}$。
验证:$AA^{-1} = \begin{pmatrix}1&2&-1\\0&1&2\\0&0&1\end{pmatrix}\begin{pmatrix}1&-2&5\\0&1&-2\\0&0&1\end{pmatrix} = \begin{pmatrix}1&0&0\\0&1&0\\0&0&1\end{pmatrix} = I$ ✓
矩阵方程
利用逆矩阵可以求解三种基本形式的矩阵方程,每种对应不同的左右乘关系:
这里的关键是区分方程中未知矩阵 $X$ 是乘在 $A$ 的左边还是右边。由于矩阵乘法不满足交换律,左右的位置不能互换。一个常见技巧是:$X$ 在 $A$ 的哪一侧,$A^{-1}$ 就乘在哪一侧。如果两侧都有矩阵,则左边的逆左乘、右边的逆右乘。
- $AX = B$($A$ 可逆)$\Rightarrow X = A^{-1}B$
- $XA = B$($A$ 可逆)$\Rightarrow X = BA^{-1}$
- $AXB = C$($A,B$ 可逆)$\Rightarrow X = A^{-1}CB^{-1}$
注意左右乘的顺序不能错——因为矩阵乘法不交换。

为什么需要分块矩阵?
处理大型矩阵时,把所有元素一目了然地写出来往往不现实,也没必要。例如一个 $100\times 100$ 的矩阵,如果它恰好是块对角结构(只有对角线上的几个小块非零),我们完全可以把它当作几个小矩阵来处理。分块矩阵的核心思想是:把大问题分解为小问题,把高阶运算化为低阶运算,这既简化了计算,也有助于理论推导——很多定理的证明就是通过巧妙分块后利用低阶结论来完成的。
分块矩阵的定义
用若干条纵线和横线将矩阵分成若干个小矩阵,每个小矩阵称为一个子块(或子矩阵)。以子块为元素构成的矩阵称为分块矩阵。
例:$A = \begin{pmatrix}1 & 0 & 0 & 2 \\ 0 & 1 & 0 & 3 \\ 0 & 0 & 1 & 4 \\ 0 & 0 & 0 & 5\end{pmatrix}$ 可分为 $A = \begin{pmatrix}I_3 & \mathbf{a} \\ 0 & 5\end{pmatrix}$,其中 $\mathbf{a} = (2,3,4)^T$。
分块矩阵的运算
加法:要求分块方式相同,对应子块相加。
数乘:每个子块乘以该数。
乘法:设 $A$ 按列分块的方式与 $B$ 按行分块的方式一致,则 $C=AB$ 的子块 $C_{ij} = \sum_k A_{ik}B_{kj}$。这本质上是把子块当作"元素"做乘法——但注意子块乘法是有顺序的(矩阵乘法不交换)。
块对角矩阵:形如 $A = \begin{pmatrix}A_1 & 0 \\ 0 & A_2\end{pmatrix}$ 的矩阵,其中 $A_1,A_2$ 是方阵。其逆矩阵为 $A^{-1} = \begin{pmatrix}A_1^{-1} & 0 \\ 0 & A_2^{-1}\end{pmatrix}$。
分块技巧在实际应用中很重要:当矩阵具有特殊结构(稀疏、带状、块对角)时,正确分块可以将一个大型问题分解为几个小型子问题。例如在有限元分析中,整体刚度矩阵通常由局部刚度矩阵装配而成,利用分块技巧可以大幅降低计算量。分块矩阵的转置和逆需要特别小心——不仅要对子块整体做转置,每个子块内部也要做转置。
分块矩阵的转置与逆
转置:将子块视为"元素"做转置后,每个子块再做一次通常的转置。
例如 $\begin{pmatrix}A & B \\ C & D\end{pmatrix}^T = \begin{pmatrix}A^T & C^T \\ B^T & D^T\end{pmatrix}$(先整体转置交换 $B$ 和 $C$ 的位置,再分别转置各子块)。
分块求逆公式(以 $2\times2$ 分块为例):若 $A = \begin{pmatrix}A_{11} & A_{12} \\ A_{21} & A_{22}\end{pmatrix}$,$A_{11}$ 可逆,则
其中 $S = A_{22} - A_{21}A_{11}^{-1}A_{12}$(称为 $A_{11}$ 的 Schur 补)。这个公式在数值线性代数中极为重要。
例题 5:用分块法求矩阵的逆
题目:$A = \begin{pmatrix}1 & 0 & 2 \\ 0 & 1 & 3 \\ 0 & 0 & 5\end{pmatrix}$,用分块法求 $A^{-1}$。
目标:掌握块对角矩阵的求逆技巧,理解分块简化计算的作用。
- 分块:将 $A$ 分为 $A = \begin{pmatrix}I_2 & B \\ 0 & 5\end{pmatrix}$,其中 $I_2 = \begin{pmatrix}1&0\\0&1\end{pmatrix}$,$B = \begin{pmatrix}2\\3\end{pmatrix}$。
- 利用公式:块对角(上三角块)的逆为 $\begin{pmatrix}I_2^{-1} & -I_2^{-1}B\cdot5^{-1} \\ 0 & 5^{-1}\end{pmatrix} = \begin{pmatrix}I_2 & -B/5 \\ 0 & 1/5\end{pmatrix}$。
- 代入:$A^{-1} = \begin{pmatrix}1 & 0 & -2/5 \\ 0 & 1 & -3/5 \\ 0 & 0 & 1/5\end{pmatrix}$。
验证:$AA^{-1} = \begin{pmatrix}1&0&2\\0&1&3\\0&0&5\end{pmatrix}\begin{pmatrix}1&0&-2/5\\0&1&-3/5\\0&0&1/5\end{pmatrix} = I_3$ ✓
复习速查
| 概念 | 定义 / 公式 | 关键点 |
|---|---|---|
| 矩阵定义 | $m\times n$ 矩形数表 $A=(a_{ij})$ | 先行后列,$a_{ij}$ |
| 矩阵加法 | 对应位置相加 | 必须同型 |
| 矩阵数乘 | 每个元素乘 $\lambda$ | $\lambda A = (\lambda a_{ij})$ |
| 矩阵乘法 | $c_{ij}=\sum_k a_{ik}b_{kj}$ | $A$ 列数 = $B$ 行数,不交换 |
| 转置 $A^T$ | 行列互换 | $(AB)^T = B^TA^T$ |
| 对称矩阵 | $A^T = A$ | $a_{ij}=a_{ji}$ |
| 初等行变换 | 对换、倍乘、倍加 | 高斯消元的三种操作 |
| 初等矩阵 | 对 $I$ 做一次初等变换 | 左乘=行变换,右乘=列变换 |
| 逆矩阵 $A^{-1}$ | $AA^{-1}=I$ | 唯一,$(AB)^{-1}=B^{-1}A^{-1}$ |
| 求逆法 (1) | $(A \mid I) \xrightarrow{\text{行变换}} (I \mid A^{-1})$ | 最实用,只做行变换 |
| 分块乘法 | $C_{ij}=\sum_k A_{ik}B_{kj}$ | 分块一致,子块顺序不变 |
| 块对角逆 | $\begin{pmatrix}A&0\\0&B\end{pmatrix}^{-1}=\begin{pmatrix}A^{-1}&0\\0&B^{-1}\end{pmatrix}$ | 各子块分别求逆 |
参考来源
- 电子科技大学线性代数课程组(邓良剑):线性代数枢纽页 · 讲义 PDF(1.1 矩阵概念、1.2 高斯消元法、1.3 逆矩阵、1.4 分块矩阵)
- 我是8位的博客:https://www.cnblogs.com/bigmonkey/p/7646005.html — 矩阵基本运算科普
- CSDN 矩阵乘法笔记:https://blog.csdn.net/deniece1/article/details/101982637 — 乘法性质与例子
- MIT 线性代数笔记(03 矩阵乘法和逆矩阵):https://zhuanlan.zhihu.com/p/45750189 — 四种视角理解乘法
- OI Wiki — 初等变换:https://oi-wiki.org/math/linear-algebra/elementary-operations/ — 初等变换与初等矩阵系统说明
- 上海交通大学线性代数讲义:https://basics.sjtu.edu.cn/~yangqizhe/pdf/la2024s/slides/LALec3-handout-zh.pdf — 分块矩阵规范说明