第一章 绪论
- 理解旋量(screw)是什么,它为什么是刚体运动的"自然"描述工具
- 掌握全书的核心框架:瞬时旋量 ↔ se(3),有限位移旋量 ↔ SE(3)
- 了解旋量代数从 Mozzi/Ball/Clifford 到 Dimentberg 的完整历史脉络
- 能够回答:为什么传统欧拉角不够用,为什么需要引入旋距(pitch)
绪论是全书的地图。旋量代数恰恰是在历史脉络中才能理解其"为什么这样定义"的学科——从 18 世纪的几何直觉到 19 世纪的代数化,再到 20 世纪与李群理论的汇流。
本章之后:第二章建立直线几何(Plücker 坐标),第三章正式引入旋量代数运算,第四章开始指数映射。
前置知识回顾
- 旋转矩阵:$3\times3$ 正交矩阵,行列式为 1,描述刚体姿态。去哪里补:线性代数教材。
- 齐次变换:$4\times4$ 矩阵同时编码旋转和平移,$T = \begin{pmatrix} R & \mathbf{p} \\ \mathbf{0}^T & 1 \end{pmatrix}$。去哪里补:机器人学基础教材第 2 章。
- 叉积:$\mathbf{a}\times\mathbf{b}$ 垂直于 $\mathbf{a}$ 和 $\mathbf{b}$,模长等于平行四边形面积。去哪里补:线性代数教材。
- 群:带有封闭、结合、单位元、逆元运算的集合。$SO(3)$(旋转群)和 $SE(3)$(运动群)是典型例子。可选项,本书会逐步引入。
传统刚体运动学用欧拉角 + 平移向量描述 6 自由度运动,存在三个根本困难:
- 参数冗余:旋转矩阵 9 个参数描述 3 个自由度,需额外约束 $R^T R = I$。9 个数只描述 3 个独立的变化方向,6 个约束方程是"浪费"。
- 奇异性麻烦:欧拉角在某些姿态附近会产生万向锁(Gimbal lock),两个旋转轴重合导致丢失一个自由度。在机器人轨迹规划中,奇异点附近的速度会趋于无穷。
- 几何直观丢失:旋转和平移被分别处理,无法统一描述"螺旋运动"——刚体绕轴旋转的同时沿轴平移。而螺旋运动恰好是刚体运动最自然的形态。
Chasles 定理(1830):任意刚体位移都可以分解为绕某一轴的旋转加上沿该轴的平移。
这意味着刚体运动的所有可能性,可以用一个五维参数(4 个轴线参数 + 1 个旋距)来描述。Chasles 定理给出了旋量代数的几何基础——每一条刚体位移对应一条空间轴和一个旋转+平移的量。
旋量理论相对于欧拉角/四元数有两大优势:
旋量(screw)是一个几何体,一个具有旋距(pitch)的线矢量。
拆开来看:"线矢量"是一条空间直线,带方向 $\mathbf{s}$(三维单位向量)和位置(由线上一点 $\mathbf{r}$ 决定);"旋距" $h$ 是一个标量,衡量该旋量中旋转分量与平移分量的比例关系。
几何上,旋量对应刚体的螺旋运动:绕某轴旋转 + 沿同一轴平移的合成。物理上,旋量可以描述速度(角速度 + 线速度)或力(力 + 力矩)。
数学上,旋量是一个六维向量,分为主部 $\mathbf{s}$(方向,三维)和副部 $\mathbf{s}_0$(矩,三维):
其中 $\mathbf{r}$ 是轴线上一点的位置向量,$h$ 是旋距。主部 $\mathbf{s}$ 确定轴线的方向,副部 $\mathbf{s}_0$ 同时编码了轴线的位置($\mathbf{r}\times\mathbf{s}$ 部分)和旋距($h\mathbf{s}$ 部分)。
旋距定义为副部在主部上的投影与主部模长的比值:
旋距的几何意义:当物体做螺旋运动时,沿轴线平移的距离与转角(弧度制)的比值。$h = 0$ 意味着只旋转不平移;$h \to \infty$ 意味着只平移不旋转。
| 类型 | 条件 | 物理含义 |
|---|---|---|
| 线矢量 | $h = 0$ | 纯旋转,或纯力(方向与作用线确定) |
| 纯旋量 | $\mathbf{s} = \mathbf{0}$ | 纯力矩 / 纯平移,作用点无关 |
| 一般旋量 | $h \neq 0$ | 螺旋运动(旋转 + 沿轴平移) |
一个旋量具有 5 个独立参数(4 个来自线矢量:方向 2 + 线上点 2,加上 1 个旋距),构成五维射影空间中的元素。注意 screw(Ball 1876,用于刚体运动)与 spinor(Cartan 1913,用于电子自旋)中文译名相同但研究对象完全不同。
旋量理论不是被某一个人"发明"的,而是被不同时代的数学家从不同角度逐步发现的。这段历史本身就揭示了旋量代数与多个数学分支的深刻联系。
| 时间 | 人物 | 贡献 | 意义 |
|---|---|---|---|
| 1763 | Mozzi | 刚体瞬时运动轴 | 首次提出瞬时旋量概念:任何瞬时刚体运动都可归结为绕某轴的转动 |
| 1806 | Poinsot | 力中心轴定理 | 将力的作用归结为沿某轴的力和力矩,揭示力学的几何本质 |
| 1830 | Chasles | 刚体位移定理 | 任意刚体位移 = 绕轴旋转 + 沿轴平移,旋量几何的核心基础 |
| 1869 | Plücker, Klein, Ball | 直线坐标、互易旋量 | 建立直线几何基础,Plücker 坐标使直线可被代数化描述 |
| 1876 | Ball | 系统研究旋量理论 | 划时代著作《A Treatise on the Theory of Screws》,建立完整理论体系 |
| 1882 | Clifford | 矩量代数(对偶数) | 引入对偶元 $\epsilon$,将位置信息编码到方向中,旋量代数化的关键一步 |
| 1870s | Klein, Lie | 奠定李群和李代数基础 | Klein 的 Erlangen 纲领和 Lie 的连续变换群理论,为代数框架统一铺路 |
| 1924 | von Mises | 旋量运算系统化 | 将旋量运算整理为完整的计算体系 |
| 1947 | Brand | 矩量代数 | 将旋量代数应用于力学问题 |
| 1965 | Dimentberg | 有限位移旋量 | 首次正式提出"有限位移旋量",实现瞬时到有限位移的飞跃 |
Klein 的 Erlangen 纲领(1872)和 Lie 的李群理论在同一时期发展,加上 Klein 同时研究旋量理论和射影几何,使得 Klein 成为连接旋量几何与李群理论的桥梁。这段历史揭示了一个重要事实:旋量代数与李群、李代数的联系不是事后附加的,而是从空间直线运动的研究中自然涌现的。
全书最核心的一幅图揭示了旋量代数与李群/李代数的双线对应:
| 旋量概念 | 李群/李代数 | 含义 |
|---|---|---|
| 瞬时旋量 | se(3)(李代数) | 速度:角速度 + 线速度 |
| 有限位移旋量 | SE(3)(李群) | 有限位移:旋转 + 平移 |
| 速度旋量(twist) | se(3) 的元素 | 刚体的瞬时运动状态 |
| 力旋量(wrench) | se*(3) 的元素 | 力与力矩 |
| 指数映射 | exp: se(3) → SE(3) | 瞬时 → 有限位移 |
se(3) 是 SE(3) 在单位元处的切空间。直观理解:李代数 se(3) 描述"无穷小的运动"(速度),李群 SE(3) 描述"有限大小的运动"(位移),指数映射是把"速度乘以时间"积分为"位移"的数学工具。
SE(3) 的伴随表示可用 $6\times6$ 有限位移旋量矩阵实现,用于路径与轨迹规划(第五章核心内容)。有限位移旋量的对偶正交矩阵形式可以表述为 SE(3) 的六维表示。
有限位移旋量从瞬时到有限经历了三个重要阶段:
- Rodrigues 参数(1840):用三个参数构建 Rodrigues 向量 $\mathbf{b} = \tan(\theta/2)\,\mathbf{u}$,建立从李代数 so(3) 到李群 SO(3) 的指数映射。Rodrigues 公式给出绕单位轴 $\mathbf{u}$ 旋转角度 $\theta$ 的旋转矩阵:
$$R = I + \hat{\mathbf{u}}\sin\theta + \hat{\mathbf{u}}^2(1-\cos\theta)$$
其中 $\hat{\mathbf{u}}$ 是 $\mathbf{u}$ 的反对称矩阵。Klein 指出 Euler-Rodrigues 参数实际上是 Hamilton 四元数的 Rodrigues 参数化。
- 对偶四元数(Clifford, 1873):$\hat{q} = q_0 + \epsilon q$,实部 $q_0$ 表示旋转,虚部 $\epsilon q$ 表示平移。双四元数将旋转与平移统一在一个代数结构中,比 Rodrigues 公式更简洁,满足 $\epsilon^2 = 0$。
- 有限位移旋量(Dimentberg, 1965):首次正式提出"有限位移旋量"名称和完整理论框架,实现旋量理论由瞬时到非瞬时的飞跃。有限位移旋量不要求微小位移——它描述任意两个刚体位姿之间的变换。
所有旋量的集合构成一个旋量系 $\mathcal{S}$,其阶数 $n$ 由最大线性无关旋量组确定。旋量系的研究引出两个核心问题:
- 旋量系与其互易旋量系是什么关系?→ 第七章的关联关系定理(定理 7.1)
- 给定约束旋量后,允许的运动旋量有哪些?→ 第八章的零空间构造理论
这两个问题对应线性代数中矩阵秩与零空间的关系,是旋量代数与线性代数最深刻的类比之一:$\dim(\mathcal{S}) + \dim(\mathcal{S}_r) = 6$,旋量系的互易系就是它的"正交补"。
- 旋量定义:六维向量 $(\mathbf{s}; \mathbf{s}_0)$,具有旋距的线矢量
- 旋距 $h = \frac{\mathbf{s}\cdot\mathbf{s}_0}{\mathbf{s}\cdot\mathbf{s}}$:旋转与平移的比例,为不变量
- Chasles 定理:任意刚体位移 = 绕轴旋转 + 沿轴平移
- 核心框架:瞬时旋量 ↔ se(3),有限位移旋量 ↔ SE(3)
- 速度旋量 $se(3)$ 元素 | 力旋量 $se^*(3)$ 元素
- 历史三节点:Ball(1876) 几何直觉 → Clifford(1882) 代数化 → Dimentberg(1965) 有限位移
- Rodrigues 公式 $R = I + \hat{\mathbf{u}}\sin\theta + \hat{\mathbf{u}}^2(1-\cos\theta)$
参考来源
- 戴建生 (2014)《旋量代数与李群、李代数》第一章,P.1-P.22。教材:
media/screw-algebra/screw-algebra-lie-groups.pdf - Screw theory - Wikipedia(概念定义参考,Screw/Twist/Wrench 的代数运算体系)
- 旋量理论 vs 其他方法的比较 - Math StackExchange(旋量相对于欧拉角/四元数的两大优势)
- Exponential Coordinates - Northwestern Modern Robotics(Twist/Wrench 定义与指数映射)