集合论
现代数学的大厦几乎全部建立在集合论之上:自然数是集合,函数是集合(有序对的集合),概率空间是三元组 $(S, \mathcal{B}, P)$,而 $\mathcal{B}$(σ 代数)本身就是一个满足特定条件的集合的集合。理解集合论,就是理解数学语言最底层的语法。
集合论的故事始于 19 世纪末康托尔(Georg Cantor)对"无穷"的大胆探索,历经罗素悖论的冲击,最终走向 ZFC 公理化体系的严谨重建。这条路径揭示了数学在追求严格性时遭遇的深层困境——哥德尔不完备性定理告诉我们,任何足够强大的公理系统都存在"不可判定"的命题。
1874 年,德国数学家格奥尔格·康托尔证明了一个反直觉的结论:并非所有无穷都是"一样大"的。他证明了实数集 $\mathbb{R}$ 不可数——即使把所有自然数用完,也无法与所有实数一一对应。
康托尔的核心工具是一一对应(bijection):两个集合"等势"(基数相同)当且仅当它们之间可以建立一一映射。基于此,他定义了基数(cardinal number)来衡量集合的大小,以及序数(ordinal number)来刻画良序集的顺序结构。
康托尔的对角线论证(1874)
假设实数可数,列出所有实数 $r_1, r_2, r_3, \ldots$。构造新实数 $c$:$c$ 的第 $n$ 位小数与 $r_n$ 的第 $n$ 位小数不同。则 $c$ 不在列表中,矛盾。
因此 $|\mathbb{R}| > |\mathbb{N}|$——存在比可数无穷更大的无穷。
康托尔进一步发现了无穷的无穷:对任意集合 $A$,其幂集 $\mathcal{P}(A)$ 的严格大于 $A$ 本身(康托尔定理)。这意味着无穷的层级是无限的——永远存在更大的无穷。
康托尔建立集合论时使用的是概括原则(Comprehension Principle):对任意性质 $P(x)$,集合 $\{x : P(x)\}$ 存在。这个看似无害的原则包含着致命的矛盾。
罗素悖论(Russell's Paradox, 1901)
考虑"所有不以自身为元素的集合所组成的集合":
问:$R \in R$?
- 若 $R \in R$,则根据定义 $R \notin R$,矛盾。
- 若 $R \notin R$,则 $R$ 满足定义条件,应有 $R \in R$,矛盾。
无论哪种情况都导致矛盾。这就是著名的罗素悖论,它动摇了整个数学基础。
通俗版即"理发师悖论":某村理发师宣布"我给且只给那些不给自己刮胡子的人刮胡子"。问他给自己刮不刮?
悖论的根源在于无限制的概括原则允许构造"太大的集合"——所有集合的集合、所有不以自身为元素的集合等。这些"太大"的对象超越了集合论所能安全处理的范围。
为了修复悖论,数学家提出了两条路线:
- ZF 系统(Zermelo-Fraenkel):限制集合产生的方式,只允许公理授权的集合存在
- NBG 系统(von Neumann-Bernays-Gödel):引入"类"(class)概念,将"太大"的对象归为"真类",真类不能作为元素
ZFC(ZF + 选择公理)是当今最广泛使用的公理集合论系统。它包含 10 条公理,分为三组:
| 组别 | 公理 | 功能 |
|---|---|---|
| 第一组:定义相等 | 外延公理 | $A = B$ 当且仅当 $A, B$ 有相同元素 |
| 第二组:保证存在性 | 空集公理 | 空集 $\varnothing$ 存在 |
| 配对公理 | 对任意 $a, b$,$\{a, b\}$ 是集合 | |
| 并集公理 | 任意集合族的并集存在 | |
| 幂集公理 | 任意集合的所有子集构成集合 | |
| 无穷公理 | 存在包含所有自然数的集合 $\omega$ | |
| 替换公理 | 函数像的定义域是集合时,值域也是集合 | |
| 第三组:限制存在性 | 正则公理 | 每个非空集合有 $\in$ 最小元(排除 $A \in A$) |
| 选择公理(AC) | 任意非空集合族都有选择函数 |
子集公理模式(分类公理)
子集公理是对概括原则的修正版:
关键区别:不能凭空用性质造集合,必须先有一个"母集" $A$,从中筛选出子集。这样就避免了罗素悖论——"所有不以自身为元素的集合"没有母集,因此无法构造。
子集公理把"性质"实体化为集合 $\{x \in A : P(x)\}$,这是集合论能成为数学基础的根本原因。
没有无穷公理时,ZFC 只能产生有限的对象:$0, 0', 0'', \ldots$(其中 $0 = \varnothing$,$n' = n \cup \{n\}$)。无穷公理断言存在一个包含所有自然数的集合 $\omega$,从而打开了通往无穷世界的大门。有了它,序数宇宙展开为 $0, 1, 2, \ldots, \omega, \omega+1, \omega+2, \ldots$。
选择公理断言:对任意非空集合族 $\{A_i\}_{i \in I}$,存在函数 $f$ 使 $f(i) \in A_i$。看似显然,但它允许不可构造的选择——你不需要给出具体的选取规则,只需要知道"存在"这样的函数。
AC 等价于许多重要结论:佐恩引理(Zorn's Lemma)、良序定理(任何集合都可以良序化)、Tukey 引理等。在概率论中,AC 保证了σ 代数上的测度可以延拓(Carathéodory 延拓定理)。
1931 年,哥德尔发表了不完备性定理,给数学基础带来了更深刻的震撼:
- 第一不完备性定理:任何包含算术的、递归可公理化的、一致的形式系统中,存在既不可证明也不可否证的命题。
- 第二不完备性定理:这样的系统无法在自身内部证明自己的一致性。
对 ZFC 而言,这意味着:ZFC 中一定存在不可判定的命题,且 ZFC 无法证明自身无矛盾。
连续统假设(CH)
康托尔在 1878 年提出:在可数集基数 $\aleph_0$ 和实数集基数 $2^{\aleph_0}$ 之间,不存在其他基数。即:
1940 年,哥德尔证明 CH 与 ZFC 不矛盾(构造了 CH 成立的内模型 $L$)。
1963 年,科恩(Paul Cohen)用力迫法证明 CH 的否定也与 ZFC 不矛盾。
因此,CH 在 ZFC 中是不可判定的——既不能证明也不能否证。这是哥德尔不完备性定理的第一个重大实例。
柯尔莫哥洛夫(Kolmogorov)1933 年将概率论建立在测度论之上,而测度论的基础正是集合论。概率空间 $(S, \mathcal{B}, P)$ 的每一层都有集合论的根基:
| 概率论概念 | 集合论本质 |
|---|---|
| 样本空间 $S$ | 一个集合 |
| 事件 $A$ | $S$ 的子集,即 $A \subseteq S$ |
| σ 代数 $\mathcal{B}$ | $S$ 的幂集 $\mathcal{P}(S)$ 的子集,满足对补集和可数并集封闭 |
| 概率函数 $P$ | 定义在 $\mathcal{B}$ 上的测度($P(S) = 1$) |
| 随机变量 $X$ | $(S, \mathcal{B})$ 到 $(\mathbb{R}, \mathcal{B}_\mathbb{R})$ 的可测函数 |
| 累积分布函数 $F_X$ | 由 $P$ 和 $X$ 诱导的实数集上的测度 |
σ 代数的定义直接使用了集合论的三条封闭性要求:
- $\varnothing \in \mathcal{B}$(空集∈ σ 代数——对应 ZFC 空集公理)
- $A \in \mathcal{B} \Rightarrow A^c \in \mathcal{B}$(对补集封闭——对应 ZFC 中子集公理+补集运算)
- $A_1, A_2, \ldots \in \mathcal{B} \Rightarrow \cup_{i=1}^{\infty} A_i \in \mathcal{B}$(对可数并集封闭——对应 ZFC 并集公理)
没有集合论提供的这些精确工具,"概率空间"就只是一句模糊的话;有了集合论,概率论获得了与实分析同等的数学严格性。
实数集上最常用的 σ 代数是 Borel σ 代数 $\mathcal{B}(\mathbb{R})$——由所有开区间生成的最小 σ 代数。它包含了所有"现实中有意义"的实数子集(闭区间、单点集、可数集等),但不包含全部子集(存在不可测集,其存在性依赖于选择公理 AC)。
这再次展示了集合论与概率论的深层连接:概率论能对"几乎所有"感兴趣的集合赋予概率,但集合论告诉我们,不是所有子集都能被测量——不可测集的存在是选择公理的必然推论。
公理集合论本身已成为一个高度专业化的数学分支,研究大基数公理(large cardinals)、内模型、力迫法等。同时,也出现了替代性的数学基础方案:
| 体系 | 核心思想 | 与 ZFC 的关系 |
|---|---|---|
| 类型论(Martin-Löf Type Theory) | 命题即类型,证明即程序 | 可视为 ZFC 的替代,被 Lean/Coq 等证明助手采用 |
| ETCS(Lawvere) | 范畴论视角的"结构集合论" | 与 ZFC 等价,但从函子和态射出发 |
| HoTT(同伦类型论) | 将等价性分层的类型论,引入同伦论思想 | 比 ZFC 更精细地处理"相等"概念 |
这些替代方案各有优劣,但 ZFC 仍然是绝大多数数学家默认的工作基础。在实际研究中,多数数学家使用的是"朴素集合论"——依赖 ZFC 的安全性,但不必在每次证明时都显式引用公理。
关键概念速查
| 概念 | 含义 |
|---|---|
| 朴素集合论 | 康托尔时代的"概括原则"集合论,存在罗素悖论 |
| 公理集合论 | 通过公理限制集合的产生方式,避免悖论 |
| ZFC | Zermelo-Fraenkel + Choice,当今最主流的公理系统 |
| 基数 | 衡量集合"大小"的工具($\aleph_0$, $\aleph_1$, $2^{\aleph_0}$) |
| 序数 | 刻画良序集的顺序结构($0, 1, 2, \ldots, \omega, \omega+1, \ldots$) |
| 连续统假设 | $2^{\aleph_0} = \aleph_1$?在 ZFC 中不可判定 |
| σ 代数 | 对补集和可数并集封闭的集合族,概率空间的定义域 |
| Borel 集 | 由开区间生成的最小 σ 代数 |