正交编码与伪随机序列
课程信息
课程:现代通信原理(中南大学 尹林子)| 教材:《通信原理(第2版)》王琪等
本章涉及两大主题:正交编码(正交码、Hadamard 矩阵、Walsh 函数)和伪随机序列(LFSR、m 序列及其性质)。它们是码分多址(CDMA)和扩频通信的理论基石。
1.1 为什么需要正交编码?
在通信系统中,我们希望不同用户、不同信道之间互不干扰。直观理解:如果两路信号"完全不相似"——内积为零——那么在接收端可以完美地区分它们,就像两个互相垂直的向量,一个方向的投影对另一个方向毫无影响。这就是正交性的价值。
- 码分多址(CDMA):给不同用户分配正交码,允许多路信号在同一频率上同时传输
- 纠错码:正交码之间的汉明距离最大化,有利于检错和纠错
1.2 正交性的数学定义
正交性的本质是"不相似"——在向量空间中,两个向量内积为零意味着彼此没有分量投影到对方上。通信中借用这个概念,要求不同用户的信号互相正交,就能在接收端完美分离。
模拟信号的正交:两个周期为 $T$ 的信号 $s_1(t)$ 和 $s_2(t)$ 正交,当且仅当:
物理含义:一个信号在另一个信号"方向"上的投影为零,两者完全不相关。
数字信号的正交——用互相关系数描述:
设长为 $n$ 的码组,码元取值 $+1$ 或 $-1$。两个码组 $\mathbf{x} = (x_1, x_2, \ldots, x_n)$ 和 $\mathbf{y} = (y_1, y_2, \ldots, y_n)$ 的互相关系数定义为:
- $\rho = 0$:正交
- $\rho = 1$:完全相同
- $\rho = -1$:完全相反
二进制表示下的互相关系数
若用 $0$ 代替 $+1$,用 $1$ 代替 $-1$,则公式改写为:
其中 $A$ 是对应码元相同的个数,$D$ 是对应码元不同的个数。这个公式本质上是把乘法运算转化为了"数一致与不一致的个数"。
具体例子
所以 $s_1$ 和 $s_2$ 正交。
1.3 自相关系数
自相关系数衡量的是一个码组与自身循环移位后的相似程度——这直接关系到该码组在通信系统中的同步性能和抗干扰能力。
把互相关系数中的 $\mathbf{y}$ 换成 $\mathbf{x}$ 自身的 $j$ 次循环移位,就得到自相关系数:
其中下标按模 $n$ 运算(即 $x_{n+k} \equiv x_k$)。
1.4 超正交与双正交
- 超正交:若 $\rho(\mathbf{x}, \mathbf{y}) < 0$,称两码组超正交。若编码中任意两码组都超正交,则称超正交编码。
- 双正交编码:由正交编码加上其反码($+1 \leftrightarrow -1$ 互换)构成。例如 4 个正交码加上其 4 个反码,得到 8 个码组构成的双正交码。双正交码扩大了可用码字数目,同时保持良好的相关特性。
1.5 Hadamard 矩阵
是什么:Hadamard 矩阵($H$ 矩阵)是一种元素只取 $+1$ 和 $-1$ 的方阵,且任意不同两行(或两列)互相正交。最低阶为 2 阶。
递推构造法(核心方法):
逐步构造:
正规 Hadamard 矩阵:经过行/列交换后,使第一行和第一列全为 $+1$ 的形式,称为正规 $H$ 矩阵。
1.6 Walsh 函数(沃尔什函数)
怎么得到:将 Hadamard 矩阵的行按 $+1$/$-1$ 交变次数从小到大重新排列,就得到 Walsh 矩阵。每行对应一个 Walsh 函数 $\text{Wal}(n, t)$,其中 $n$ 就是交变次数。
Walsh 函数的关键性质:
| 性质 | 说明 |
|---|---|
| 同步正交 | 在同步条件下,任意两个 Walsh 函数完全正交 |
| 均值为0 | 除 $\text{Wal}(0,t)$ 外,其余均值均为 0 |
| 乘法自闭 | $\text{Wal}(i,t) \cdot \text{Wal}(j,t) = \text{Wal}(k,t)$ |
| 完备性 | 长度为 $N$ 的 Walsh 序列恰好有 $N$ 个,不多不少 |
| 不同步恶化 | 不同步时正交特性快速恶化——这就是 CDMA 系统必须严格同步的原因 |
2.1 为什么需要伪随机序列?
真正的随机序列不可重复,而通信中需要一种可重复产生、但统计特性近似随机的序列——这就是伪随机序列(PN序列)。它像噪声一样"不可预测",但又可以精确复制,广泛用于:
- 误码率测量:用 PN 序列模拟真实数据流
- 时延测量:利用自相关特性精确定位时延
- 扩频通信:将信号"隐藏"在噪声中,提高抗干扰能力
- 数据加扰:打乱连0/连1,利于时钟恢复
2.2 线性反馈移位寄存器(LFSR)
伪随机序列由反馈移位寄存器产生,分为线性和非线性两种。最常用的是线性反馈移位寄存器(LFSR)。
直观理解 LFSR
把 LFSR 想象成一排串联的存储单元。每个时钟脉冲到来时,所有单元的内容向右移动一位,最右边的内容输出,最左边的新内容由所有级的"异或组合"决定。这个"异或组合"就是反馈逻辑。
n 级 LFSR 的递推关系:
其中:
- $c_i \in \{0, 1\}$:反馈连接状态($c_i = 1$ 表示第 $i$ 级参与反馈)
- $\oplus$:模2加法(异或)
- 移位寄存器在时钟控制下每次右移一位,新输入由反馈逻辑决定
特征多项式:
其中 $c_0 = c_n = 1$(必有首尾连接)。$x$ 本身没有实际数值意义,$x^i$ 的存在仅表示 $c_i = 1$。
2.3 m 序列与本原多项式
m 序列(最长线性反馈移位寄存器序列)是 LFSR 能产生的周期最长的序列。
关键定理:一个 n 级 LFSR 能产生 m 序列的充要条件是其特征多项式为 n 次本原多项式。
本原多项式的三个条件
- $f(x)$ 是既约多项式(不可再分解)
- $f(x)$ 能整除 $x^p + 1$,其中 $p = 2^n - 1$
- $f(x)$ 不能整除 $x^q + 1$,其中 $q < p$
类比理解:本原多项式之于 LFSR,就像质数之于整数——它是"最基本的构建单元",不可再分,且保证状态遍历的完整性。
4 级 m 序列的具体构造
分解 $x^{15} + 1$:
4 次既约多项式有 3 个,但 $x^4+x^3+x^2+x+1$ 能整除 $x^5+1$,不满足条件(3)。所以 4 次本原多项式有两个:
以 $f_1(x) = x^4 + x + 1$ 为例,反馈逻辑为 $a_4 = a_1 \oplus a_0$(即第 1 级和第 0 级异或)。设初始状态 1000,产生周期为 15 的 m 序列。
2.4 m 序列的五大性质
这五条性质是 m 序列被称为"伪随机"的根本原因——它们逐一对应了真正随机白噪声的统计特征。
性质一:均衡性
一个周期内,"1"的个数比"0"恰好多一个:
- "1"的个数:$(p+1)/2 = 2^{n-1}$
- "0"的个数:$(p-1)/2 = 2^{n-1} - 1$
例:$n=4$,$p=15$,"1"有 8 个,"0"有 7 个。当 $n$ 足够大时,"1"和"0"几乎等概率出现。
性质二:游程分布
游程 = 连续相同码元的一段。m 序列一个周期内有 $2^{n-1}$ 个游程,其中:
| 游程长度 $k$ | 占比 | 说明 |
|---|---|---|
| 1 | $1/2$ | 短游程最多 |
| 2 | $1/4$ | |
| 3 | $1/8$ | |
| $k$ ($1 \le k \le n-2$) | $1/2^k$ | 长度每增加1,个数减半 |
| $n-1$ | 1个 | 全是连0游程 |
| $n$ | 1个 | 全是连1游程 |
且同一长度下,连1游程和连0游程各占一半。
性质三:移位相加性
m 序列与自身延迟 $r$ 位的序列做模2加法,结果仍是该 m 序列的某个延迟序列:
具体例子
设 $m_p = 000111101011001$($p=15$),延迟 2 位得 $m_r = 010001111010110$。逐位异或后得 $m_s = 010110001001111$,这恰好是 $m_p$ 延迟 8 位的结果。
这条性质是 m 序列"代数结构"的体现,也是其用于加扰/解扰的理论基础——加扰端用 m 序列异或数据,解扰端用同一个 m 序列再异或一次即可恢复。
性质四:双值自相关特性(最重要!)
将"0"映射为 $+1$、"1"映射为 $-1$ 后,自相关函数为:
推导思路:由移位相加性,$a_i \oplus a_{i+j}$ 仍是 m 序列的元素;由均衡性,一个周期内 0 比 1 少一个,故 $A - D = -1$($j \neq 0$ 时),除以 $p$ 即得 $-1/p$。
性质五:伪噪声特性
综合以上性质,m 序列的统计特性(均衡性、游程分布、自相关函数、功率谱密度)与真正的随机白噪声高度相似,因此称为伪随机序列。区别仅在于:m 序列是确定性的、周期性的。
| 特征 | 真正白噪声 | m 序列 |
|---|---|---|
| "1"与"0"概率 | 各 1/2 | 几乎各 1/2(差1个) |
| 游程分布 | 长度 $k$ 占 $1/2^k$ | 完全相同 |
| 自相关函数 | $\delta(\tau)$(冲激) | 尖锐的双值函数,$p$ 越大越接近冲激 |
| 功率谱密度 | 均匀(白色) | 趋于均匀 |
| 可重复性 | 否 | 是(确定性周期序列) |
2.5 M 序列(补充)
M 序列由非线性反馈移存器产生,周期为 $2^n$(比 m 序列多 1——因为包含了全 0 状态)。性质与 m 序列的差异:
- "0"和"1"数目完全相等(真正的均衡)
- 不再有移位相加性和双值自相关特性
- 序列数目远多于 m 序列($n=10$ 时,m 序列仅 60 个,M 序列有 $1.3 \times 10^{151}$ 个)
| 应用 | 原理 |
|---|---|
| 误码率测量 | 发端发 PN 序列,收端比较,统计错误比特数 |
| 时延测量 | 利用自相关峰的尖锐性,通过相关运算精确定位时延 |
| 数据加扰 | 用 m 序列与数据异或,消除长连0/连1;收端用相同 m 序列异或恢复 |
| 扩频通信 | 用高速 PN 序列展宽信号频带,提高抗干扰和抗截获能力 |
| 分离多径 | 利用 PN 序列的自相关特性分离和合并多径信号 |
| 概念 | 核心公式/结论 | 要点 |
|---|---|---|
| 互相关系数 | $\rho = \frac{A-D}{n}$ 或 $\frac{1}{n}\sum x_i y_i$ | $\rho=0$ 正交,$\rho<0$ 超正交 |
| 自相关系数 | $\rho_x(j) = \frac{1}{n}\sum x_i x_{i+j}$ | 下标模 $n$ |
| Hadamard 矩阵 | $H_{2N} = \begin{bmatrix} H_N & H_N \\ H_N & -H_N \end{bmatrix}$ | 行行正交、列列正交 |
| Walsh 函数 | $H$ 矩阵按交变次数重排 | 同步正交,不同步恶化 |
| m 序列周期 | $p = 2^n - 1$ | $n$ 为移存器级数 |
| 本原多项式 | 既约 + 整除 $x^p+1$ + 不整除更小次幂 | 产生 m 序列的充要条件 |
| 均衡性 | "1"比"0"多1个 | $(p+1)/2$ vs $(p-1)/2$ |
| 游程分布 | 长度 $k$ 占 $1/2^k$ | 连1连0各半 |
| 自相关 | $R(0)=1$,$R(j\neq 0)=-1/p$ | 双值自相关 |
| M 序列周期 | $p = 2^n$ | 非线性反馈,含全0态 |
参考来源
- m 序列(最长线性反馈移位寄存器序列)详解 — 腾讯云
- 正交编码与正交沃尔什函数详解 — 腾讯云
- 伪随机序列——m序列及MATLAB仿真 — 阿里云
- Gold code — Wikipedia
- 教材:《通信原理(第2版)》王琪等
- 课程:中南大学 尹林子·现代通信原理