ESC
输入关键词搜索文章
目录

多元随机变量

第 5 章 · 洪永淼 · XMU WISE
从联合分布到条件分布,理解随机变量之间的相依结构
一、概述
一、概述:为什么要从一元走向多元

前几章主要研究单个随机变量的概率分布、期望、方差和常见分布。本章的核心转向是:许多经济和金融问题并不只关心一个随机变量本身,而关心多个随机变量如何共同变化。例如,收入与消费、价格与需求、两个资产收益率、市场状态与工资分布、当前信息与未来收益,这些问题都要求我们描述“同一个概率空间上多个随机变量的联合行为”。

随机向量是本章的起点。一个 $n$ 维随机向量 $(Z_1,\dots,Z_n)'$ 是从样本空间到 $\mathbb R^n$ 的映射。课程主要以二维随机向量 $(X,Y)$ 展开,因为二元分布已经包含多元概率分布的大部分关键思想:联合分布刻画整体,边际分布刻画单个变量,条件分布刻画在已知一个变量时另一个变量如何分布,协方差和相关系数刻画线性联动,独立性刻画最强意义上的“没有相依关系”,条件期望则刻画预测关系。

从经济学角度看,本章的主线可以概括为:联合分布用于描述经济变量之间的整体关系,条件分布和条件矩用于预测与决策,协方差矩阵用于度量多个变量的风险结构,多元正态分布提供了一个可计算、可解释、可推广的基准模型。

二、核心概念
二、核心概念
1. 联合分布函数、联合 PMF 与联合 PDF

两个随机变量 $X,Y$ 的联合分布函数,或联合 CDF,定义为

$$F_{XY}(x,y)=P(X\le x,Y\le y).$$

它给出随机点 $(X,Y)$ 落在左下矩形区域 $(-\infty,x]\times(-\infty,y]$ 中的概率。联合 CDF 满足三个基本性质:当任一坐标趋于 $-\infty$ 时概率为 0;当两个坐标均趋于 $\infty$ 时概率为 1;它关于每个变量非递减且右连续。

边际 CDF 可由联合 CDF 得到:

$$F_X(x)=F_{XY}(x,\infty),\qquad F_Y(y)=F_{XY}(\infty,y).$$

$X,Y$ 为离散随机变量,联合 PMF 定义为

$$f_{XY}(x,y)=P(X=x,Y=y).$$

它必须非负,并且在联合支撑 $\Omega_{XY}$ 上求和为 1。注意联合支撑通常不等于 $\Omega_X\times\Omega_Y$。例如若 $X,Y$ 均为非负整数但受约束 $X\le Y$,则 $\Omega_X=\Omega_Y=\{0,1,2,\dots\}$,但 $\Omega_{XY}=\{(x,y):0\le x\le y\}$,只是笛卡尔乘积的子集。

$X,Y$ 为连续随机变量,联合 PDF $f_{XY}(x,y)$ 满足

$$P((X,Y)\in A)=\iint_A f_{XY}(x,y)\,dxdy,$$

$f_{XY}\ge0$,在全平面上积分为 1。当联合 CDF 足够光滑时,联合 PDF 是联合 CDF 的混合偏导:

$$f_{XY}(x,y)=\frac{\partial^2 F_{XY}(x,y)}{\partial x\partial y}.$$
PDF联合分布定义p.3
正在渲染 PDF 第 3 页…
联合分布定义(PDF 第 3 页) · 打开原文
2. 边际分布

边际分布回答的问题是:如果只关心 $X$,不关心 $Y$,应怎样从联合分布中“消去” $Y$

离散情形:

$$f_X(x)=\sum_{y\in\Omega_Y}f_{XY}(x,y),\qquad f_Y(y)=\sum_{x\in\Omega_X}f_{XY}(x,y).$$

连续情形:

$$f_X(x)=\int_{-\infty}^{\infty}f_{XY}(x,y)dy,\qquad f_Y(y)=\int_{-\infty}^{\infty}f_{XY}(x,y)dx.$$

“边际”这个词容易被误解。在经济学中,边际效用和边际生产率常常来自导数;但概率论中的边际 PDF 是通过对另一个变量求和或积分得到的。它保留一个变量的信息,同时丢弃另一个变量的信息。

一个重要提醒是:边际分布不能唯一决定联合分布。课件例 5.7 中,两个二值随机变量 $X,Y$ 在两种不同联合分布下都可以有 $X\sim Bernoulli(p)$$Y\sim Bernoulli(p)$,但第一种可能使二者完全同向取值,第二种可能是独立伯努利。这说明联合分布包含边际分布以外的“关系信息”。

3. 条件分布

条件分布刻画“给定 $X=x$ 后,$Y$ 如何分布”。离散情形中,若 $f_X(x)>0$

$$f_{Y|X}(y|x)=P(Y=y|X=x)=\frac{f_{XY}(x,y)}{f_X(x)}.$$

连续情形中,虽然 $P(X=x)=0$,但仍可通过密度比定义条件 PDF:

$$f_{Y|X}(y|x)=\frac{f_{XY}(x,y)}{f_X(x)},\qquad f_X(x)>0.$$

条件分布本身仍然是一个关于 $y$ 的合法概率分布,非负且积分或求和为 1。乘法法则也由此得到:

$$f_{XY}(x,y)=f_{Y|X}(y|x)f_X(x)=f_{X|Y}(x|y)f_Y(y).$$

在经济学中,条件分布比边际分布更接近预测问题。例如,若 $X$ 表示市场状态,$Y$ 表示股票收益率,则 $f_{Y|X}(y|x)$ 可以描述熊市和牛市中收益率波动的差异;若 $X$ 表示性别虚拟变量,$Y$ 表示工资,则 $f_{Y|X}(y|0)$$f_{Y|X}(y|1)$ 分别描述不同群体的工资分布。

PDF边缘分布与条件分布p.30
正在渲染 PDF 第 30 页…
边缘分布与条件分布(PDF 第 30 页) · 打开原文
4. 独立性与不相关

$$F_{XY}(x,y)=F_X(x)F_Y(y),\quad \forall x,y,$$

$X,Y$ 相互独立。对离散或连续情形,等价地有

$$f_{XY}(x,y)=f_X(x)f_Y(y).$$

独立性还等价于条件分布等于边际分布:

$$f_{Y|X}(y|x)=f_Y(y),\qquad f_{X|Y}(x|y)=f_X(x).$$

直观地说,如果 $X$$Y$ 独立,知道 $X=x$ 不改变 $Y$ 的概率分布。

不相关是较弱的概念,只表示协方差为 0。独立性推出不相关,但不相关一般不能推出独立。课件例 5.29 与例 5.35 给出典型反例:若 $X$ 关于 0 对称,$Y=X^2$,则 $cov(X,Y)=E(X^3)-E(X)E(X^2)=0$,但 $Y$ 完全由 $X$ 决定,二者显然不独立。这说明协方差和相关系数只能捕捉线性关系,不能捕捉一般非线性相依。

两个重要例外值得记住:在二元正态分布中,不相关等价于独立;在二值伯努利变量中,若边际给定且 $cov(X,Y)=0$,也可推出独立。

5. 协方差、相关系数与协方差矩阵

协方差定义为

$$cov(X,Y)=E[(X-\mu_X)(Y-\mu_Y)]=E(XY)-\mu_X\mu_Y.$$

$X,Y$ 倾向于同向偏离均值,协方差为正;若倾向于反向偏离均值,协方差为负;若线性联动为零,协方差为 0。协方差有量纲,受变量单位影响,因此常使用标准化协方差,即相关系数:

$$\rho_{XY}=\frac{cov(X,Y)}{\sigma_X\sigma_Y},\qquad |\rho_{XY}|\le1.$$

相关系数衡量线性关系强度。若 $Y=a+bX$$b>0$$\rho_{XY}=1$$b<0$$\rho_{XY}=-1$。但相关不是因果。石油价格与经济增长、抽烟与癌症等变量之间可能存在相关关系,但仅凭相关性不能推出因果机制。

在多元随机向量 $X=(X_1,\dots,X_n)'$ 中,协方差矩阵 $\Sigma$ 的对角线元素是各变量方差,非对角线元素是两两协方差:

$$\Sigma_{ij}=cov(X_i,X_j).$$

协方差矩阵是金融投资组合理论的基础。若资产收益向量为 $R$,权重向量为 $w$,投资组合收益 $R_p=w'R$,则

$$E(R_p)=w'E(R),\qquad var(R_p)=w'\Sigma w.$$

因此,风险不仅取决于单个资产方差,也取决于资产之间的协方差。

补充例题:由联合分布求协方差

已知二维离散随机变量 $(X,Y)$ 的联合分布律为:

$X \backslash Y$$0$$1$
$0$$1/4$$1/4$
$1$$0$$1/2$

$E(X)$$E(Y)$$E(XY)$$Cov(X,Y)$

解题过程

先求边际分布:

$$P(X=0)=\frac12,\qquad P(X=1)=\frac12.$$
$$P(Y=0)=\frac14,\qquad P(Y=1)=\frac34.$$

因此

$$E(X)=0\cdot \frac12+1\cdot \frac12=\frac12,\qquad E(Y)=0\cdot \frac14+1\cdot \frac34=\frac34.$$

再求乘积期望:

$$E(XY)=1\cdot 1\cdot \frac12=\frac12.$$

于是

$$Cov(X,Y)=E(XY)-E(X)E(Y)=\frac12-\frac12\cdot\frac34=\frac18.$$

因为 $Cov(X,Y)=\frac18>0$,所以 $X$$Y$正线性相关

协方差例题:由联合分布律计算 $E(X)$$E(Y)$$E(XY)$$Cov(X,Y)$
解释:协方差的符号反映“同向还是反向偏离均值”。若一个变量偏大时另一个变量也更容易偏大,则协方差通常为正;若一个偏大时另一个更容易偏小,则协方差通常为负。
补充例题:课件中的相关系数计算

相关系数定义为

$$\rho_{XY}=\frac{Cov(X,Y)}{\sqrt{DX}\sqrt{DY}},\qquad D(\star)=E(\star^2)-[E(\star)]^2.$$

课件中的例题给出二维随机变量 $(X,Y)$ 的联合分布律:

$X \backslash Y$$0$$1$$2$
$0$$1/9$$2/9$$1/9$
$1$$2/9$$2/9$$0$
$2$$1/9$$0$$0$
相关系数例题:从联合分布律出发,依次计算边际分布、方差、协方差与相关系数

完整计算链

先由边际分布得

$$E(X)=\frac23,\qquad E(X^2)=\frac89,\qquad DX=\frac89-\left(\frac23\right)^2=\frac49.$$

同理

$$E(Y)=\frac23,\qquad E(Y^2)=\frac89,\qquad DY=\frac49.$$

再看乘积变量 $XY$,只有 $(1,1)$ 这一格贡献非零,因此

$$E(XY)=0\cdot \frac79+1\cdot \frac29=\frac29.$$

于是协方差为

$$Cov(X,Y)=E(XY)-E(X)E(Y)=\frac29-\frac23\cdot\frac23=-\frac29.$$

最终相关系数

$$\rho_{XY}=\frac{-\frac29}{\sqrt{\frac49}\sqrt{\frac49}}=\frac{-\frac29}{\frac49}=-\frac12.$$

所以该例中 $X,Y$负相关,并且线性相关程度为 $-1/2$

PDF协方差与相关系数p.60
正在渲染 PDF 第 60 页…
协方差与相关系数(PDF 第 60 页) · 打开原文
三、关键定理与推导
三、关键定理与推导
1. 二元变换与随机向量线性变换

$(X,Y)$ 的联合 PDF 已知,并定义

$$U=g_1(X,Y),\qquad V=g_2(X,Y).$$

当变换一一、连续可导且雅可比行列式非零时,设反函数为

$$X=h_1(U,V),\qquad Y=h_2(U,V).$$

$$f_{UV}(u,v)=f_{XY}(h_1(u,v),h_2(u,v))\left|\det J_{XY}(u,v)\right|.$$

这里 $J_{XY}(u,v)$ 是反变换的雅可比矩阵。其直观含义是:密度在变量变换下需要按面积伸缩比例调整。课件用 $U=X+Y,V=X$ 推导两个独立均匀变量之和的三角密度,也用 $U=X+Y,V=X-Y$ 说明独立正态变量的线性组合仍可形成独立正态变量。

对随机向量,线性变换尤其重要。若 $X\sim N(\mu,\Sigma)$,且 $Y=A X+b$,则

$$Y\sim N(A\mu+b,A\Sigma A').$$

这条性质是多元正态分布在统计推断、投资组合和计量经济模型中广泛使用的原因。

PDF随机向量变换p.150
正在渲染 PDF 第 150 页…
随机向量变换(PDF 第 150 页) · 打开原文
2. 多元正态分布的定义与性质

二维正态分布 $(X,Y)\sim BN(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)$ 的联合 PDF 为

$$f_{XY}(x,y)=\frac{1}{2\pi\sigma_1\sigma_2\sqrt{1-\rho^2}}\exp\left\{-\frac{1}{2(1-\rho^2)}\left[\left(\frac{x-\mu_1}{\sigma_1}\right)^2+\left(\frac{y-\mu_2}{\sigma_2}\right)^2-2\rho\frac{x-\mu_1}{\sigma_1}\frac{y-\mu_2}{\sigma_2}\right]\right\}.$$

矩阵形式更简洁:

$$f(z)=\frac{1}{(2\pi)^{n/2}|\Sigma|^{1/2}}\exp\left[-\frac12(z-\mu)'\Sigma^{-1}(z-\mu)\right].$$

多元正态的几个核心性质:第一,边际分布仍为正态;第二,条件分布仍为正态;第三,线性变换仍为正态;第四,在正态族中,零协方差等价于独立;第五,联合 MGF 为

$$M_X(t)=\exp\left(\mu't+\frac12t'\Sigma t\right).$$

二维正态的条件分布为

$$Y|X=x\sim N\left(\mu_2+\rho\frac{\sigma_2}{\sigma_1}(x-\mu_1),\ \sigma_2^2(1-\rho^2)\right).$$

这说明 $\rho$ 既控制线性预测斜率,也控制条件方差。当 $|\rho|$ 越大,给定 $X$$Y$ 的剩余不确定性 $\sigma_2^2(1-\rho^2)$ 越小。当 $\rho=0$ 时,条件均值不依赖 $x$,且 $X,Y$ 独立。

PDF多元正态分布p.100
正在渲染 PDF 第 100 页…
多元正态分布(PDF 第 100 页) · 打开原文

二元正态分布的等高线由二次型

$$(z-\mu)'\Sigma^{-1}(z-\mu)=c$$

决定,是一族椭圆。均值向量决定椭圆中心;$\sigma_1,\sigma_2$ 决定沿各方向的尺度;$\rho$ 决定椭圆倾斜方向和狭长程度。$\rho>0$ 时椭圆沿右上方向倾斜,$\rho<0$ 时沿右下方向倾斜,$|\rho|$ 越接近 1,椭圆越扁。

3. 条件期望、迭代期望与方差分解

条件期望定义为对条件分布求期望。若连续,则

$$E[g(X,Y)|X=x]=\int_{-\infty}^{\infty}g(x,y)f_{Y|X}(y|x)dy.$$

特别地,条件均值

$$E(Y|X=x)=\int y f_{Y|X}(y|x)dy.$$

$x$ 的函数,也称为 $Y$$X$ 的回归函数。它是均方误差准则下预测 $Y$ 的最优函数:

$$E(Y|X)=\arg\min_g E[Y-g(X)]^2.$$

回归恒等式为

$$Y=E(Y|X)+\varepsilon,\qquad E(\varepsilon|X)=0.$$

这说明条件均值吸收了 $X$ 中可用于预测 $Y$ 的系统信息,误差项与 $X$ 的任意可测函数正交。

迭代期望定律,或全期望法则,是本章最重要公式之一:

$$E[g(X,Y)]=E_X\{E[g(X,Y)|X]\}=E_Y\{E[g(X,Y)|Y]\}.$$

推导基于乘法法则 $f_{XY}=f_{Y|X}f_X$

$$\begin{aligned}E[g(X,Y)]&=\int\int g(x,y)f_{XY}(x,y)dxdy\\&=\int\left[\int g(x,y)f_{Y|X}(y|x)dy\right]f_X(x)dx\\&=E_X\{E[g(X,Y)|X]\}.\end{aligned}$$

条件方差定义为

$$var(Y|X)=E\{[Y-E(Y|X)]^2|X\}=E(Y^2|X)-[E(Y|X)]^2.$$

它刻画给定信息 $X$$Y$ 的剩余波动。若 $var(Y|X)$ 不依赖 $X$,称为条件同方差;若依赖 $X$,称为条件异方差。金融收益率常见条件异方差,ARCH 模型就是用过去收益平方解释当前条件方差:

$$var(Y_t|I_{t-1})=\alpha+\beta Y_{t-1}^2.$$

方差分解定理为

$$var(Y)=var[E(Y|X)]+E[var(Y|X)].$$

第一项表示可预测部分的波动,第二项表示平均不可预测波动。这为回归解释力和预测误差提供了概率论基础。

PDF条件期望与预测p.180
正在渲染 PDF 第 180 页…
条件期望与预测(PDF 第 180 页) · 打开原文
四、关键例题
四、关键例题
例题1:离散联合 PMF、支撑与边际分布

课件例 5.2 与例 5.6 设

$$f_{XY}(x,y)=c|x+y|,\qquad x=-1,0,1;\ y=0,1.$$

归一化条件给出

$$c[|-1+0|+|-1+1|+|0+0|+|0+1|+|1+0|+|1+1|]=1,$$

所以 $c=1/5$。联合支撑为

$$\Omega_{XY}=\{(-1,0),(0,1),(1,0),(1,1)\}.$$

例如

$$P(X=0,Y=1)=f_{XY}(0,1)=1/5,$$
$$P(X=1)=f_{XY}(1,0)+f_{XY}(1,1)=3/5.$$

边际 PMF 为

$$f_X(-1)=1/5,\quad f_X(0)=1/5,\quad f_X(1)=3/5.$$
$$f_Y(0)=2/5,\quad f_Y(1)=3/5.$$

这个例子强调两个要点:联合支撑未必等于边际支撑的笛卡尔积;边际分布来自对联合分布按行或按列求和。

例题2:连续联合 PDF 的边际与条件分布

课件例 5.14 设

$$f_{XY}(x,y)=e^{-y},\qquad 0<x<y<\infty.$$

支撑是上三角区域。对 $x>0$

$$f_X(x)=\int_x^\infty e^{-y}dy=e^{-x}.$$

$y>0$

$$f_Y(y)=\int_0^y e^{-y}dx=ye^{-y}.$$

条件 PDF 为

$$f_{Y|X}(y|x)=\frac{e^{-y}}{e^{-x}}=e^{-(y-x)},\qquad y>x,$$

$Y|X=x$ 等于 $x$ 加上一个指数分布变量。另一方面,

$$f_{X|Y}(x|y)=\frac{e^{-y}}{ye^{-y}}=\frac1y,\qquad 0<x<y,$$

$X|Y=y\sim U(0,y)$。由于条件分布依赖给定值,且联合 PDF 不能分解为边际 PDF 乘积,$X,Y$ 不独立。

例题3:二元正态的条件均值与条件方差

$$(X,Y)\sim BN(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho),$$

$$E(Y|X)=\mu_2+\rho\frac{\sigma_2}{\sigma_1}(X-\mu_1),$$
$$var(Y|X)=\sigma_2^2(1-\rho^2).$$

这给出了线性回归的概率基础。斜率 $\rho\sigma_2/\sigma_1$ 由相关系数与标准差比例共同决定;条件方差不依赖 $X$,所以二元正态具有条件同方差性质。若 $\rho=0$,条件均值等于 $\mu_2$,条件方差等于 $\sigma_2^2$,且 $X,Y$ 独立。

例题4:二维连续型随机变量的联合密度与概率计算

二维连续型随机变量 $(X,Y)$ 由联合概率密度函数 $f(x,y)$ 完全刻画。概率计算的核心操作是二重积分:

$$P\{(X,Y) \in A\} = \iint_A f(x,y)\,dxdy$$

归一化条件要求联合密度在全平面上积分为 1:

$$\iint_{-\infty}^{+\infty} f(x,y)\,dxdy = 1$$

以下通过两个具体例子展示基本计算方法。

二维连续型随机变量:联合密度函数的概率计算与归一化

例 1:均匀分布的概率计算

$(X,Y)$ 的联合密度为

$$f(x,y) = \begin{cases} 1, & 0 \le x \le 1,\ 0 \le y \le 1 \\ 0, & \text{其他} \end{cases}$$

$P\{X < Y\}$

在单位正方形内,$X < Y$ 对应直线 $y = x$ 上方的三角形区域:

$$P\{X < Y\} = \int_0^1 \int_x^1 f(x,y)\,dy\,dx = \int_0^1 (1-x)\,dx = \frac{1}{2}$$

由于密度恒为 1,概率等于区域的面积——上三角形恰好是正方形面积的一半。

例 2:由归一化条件确定常数

$(X,Y)$ 的联合密度为

$$f(x,y) = \begin{cases} A, & 0 \le x \le 1,\ 0 \le y \le 1 \\ 0, & \text{其他} \end{cases}$$

由归一化条件:

$$\int_0^1 \int_0^1 A\,dy\,dx = A \cdot 1 \cdot 1 = 1 \implies A = 1$$

均匀分布在单位正方形上的密度恒为 1,概率直接等于对应区域的面积。

要点:对于均匀分布(密度为常数),概率计算归结为几何面积比。归一化条件用于确定密度中的未知常数。更一般地,当密度不是常数时,概率是密度曲面下的体积,必须通过二重积分计算。
例题5:二维连续型随机变量函数的分布

已知二维随机变量 $(X,Y)$ 的联合密度为

$$f(x,y) = \begin{cases} 1, & 0 \le x \le 1,\ 0 \le y \le 1 \\ 0, & \text{其他} \end{cases}$$

$Z = Y - X$,求 $Z$ 的分布函数 $F_Z(z)$ 和概率密度函数 $f_Z(z)$

二维连续型随机变量函数的分布:$Z = Y - X$ 的 CDF 分段推导

由定义,$Z$ 的分布函数为

$$F_Z(z) = P(Z \le z) = P(Y - X \le z) = \iint_{y - x \le z} f(x,y)\,dxdy$$

在单位正方形 $[0,1] \times [0,1]$ 上,$f(x,y) = 1$,因此概率等于积分区域的面积。直线 $y = x + z$ 将正方形划分为不同形状的区域,需按 $z$ 的取值分段讨论:

情形 A:$z < -1$

直线 $y = x + z$ 位于正方形下方,$y - x \le z$ 的区域与正方形无交集:

$$F_Z(z) = 0$$

情形 B:$-1 \le z < 0$

直线穿过正方形的左下角,满足 $y - x \le z$ 的区域是一个直角三角形(图 A)。三角形直角边长为 $1 + z$,面积为 $\frac{(1+z)^2}{2}$

$$F_Z(z) = \frac{(z+1)^2}{2}$$

情形 C:$0 \le z \le 1$

直线穿过正方形的右上角,满足 $y - x \le z$ 的区域是整个正方形减去左上角的一个小三角形(图 B)。小三角形直角边长为 $1 - z$,面积为 $\frac{(1-z)^2}{2}$

$$F_Z(z) = 1 - \frac{(1-z)^2}{2} = \frac{1 + 2z - z^2}{2}$$

情形 D:$z > 1$

直线位于正方形上方,整个正方形都满足 $y - x \le z$(图 C):

$$F_Z(z) = 1$$

综合以上四段,$Z$ 的分布函数为

$$F_Z(z) = \begin{cases} 0, & z < -1 \\ \dfrac{(z+1)^2}{2}, & -1 \le z < 0 \\ \dfrac{1 + 2z - z^2}{2}, & 0 \le z \le 1 \\ 1, & z > 1 \end{cases}$$

$F_Z(z)$ 求导得概率密度函数:

$$f_Z(z) = F_Z'(z) = \begin{cases} z + 1, & -1 \le z < 0 \\ 1 - z, & 0 \le z \le 1 \\ 0, & \text{其他} \end{cases}$$

也可简洁地写成

$$f_Z(z) = 1 - |z|, \quad |z| \le 1$$
要点:求二维随机变量函数 $Z = g(X,Y)$ 的分布,通用方法是先求 CDF $F_Z(z) = P(g(X,Y) \le z)$,再对 $z$ 求导得 PDF。关键步骤是画出联合支撑与事件区域 $g(x,y) \le z$ 的交集,根据 $z$ 的不同取值分段计算积分。当联合密度为常数(均匀分布)时,概率等于交集区域的面积,几何直观可以辅助确定积分限。
例题6:二维离散随机变量的联合分布、独立性与期望

已知二维随机变量 $(X,Y)$ 的联合分布律如下:

$X$ \ $Y$$0$$1$$2$
$0$$1/9$$2/9$$1/9$
$1$$2/9$$2/9$$0$
$2$$1/9$$0$$0$
二维离散随机变量:从联合分布律求边际分布、独立性、函数分布与期望

(1)求 $X$$Y$ 的边际分布律。

对联合分布表按行求和得 $X$ 的边际分布,按列求和得 $Y$ 的边际分布:

$X$ 的边际分布

$X$$0$$1$$2$
$P$$4/9$$4/9$$1/9$

$Y$ 的边际分布

$Y$$0$$1$$2$
$P$$4/9$$4/9$$1/9$

注意 $X$$Y$ 的边际分布恰好相同,但这并不意味着联合分布有任何对称性。

(2)判断 $X$$Y$ 是否独立。

检查 $P(X=0, Y=0)$ 是否等于 $P(X=0) \cdot P(Y=0)$

$$P(X=0) \cdot P(Y=0) = \frac{4}{9} \times \frac{4}{9} = \frac{16}{81} \neq \frac{1}{9} = P(X=0, Y=0)$$

只要找到一对 $(x,y)$ 使 $P(X=x, Y=y) \neq P(X=x) \cdot P(Y=y)$,就可以否定独立性。因此 $X$$Y$ 不独立

(3)求 $Z = XY$ 的分布律。

$(X,Y)$ 的每一对取值计算 $Z = XY$

  • $Z=0$$(0,0), (0,1), (0,2), (1,0), (2,0)$$P = 1/9 + 2/9 + 1/9 + 2/9 + 1/9 = 7/9$
  • $Z=1$$(1,1)$$P = 2/9$
  • $Z=2$$(1,2)$$(2,1)$ → 概率均为 $0$
  • $Z=4$$(2,2)$ → 概率为 $0$
$Z=XY$$0$$1$
$P$$7/9$$2/9$

由于联合分布中 $(1,2)$$(2,1)$$(2,2)$ 的概率为 $0$$Z$ 只能取 $0$$1$

(4)求 $EY$$E(XY)$

$Y$ 的边际分布:

$$EY = 0 \times \frac{4}{9} + 1 \times \frac{4}{9} + 2 \times \frac{1}{9} = \frac{6}{9} = \frac{2}{3}$$

$Z = XY$ 的分布:

$$E(XY) = EZ = 0 \times \frac{7}{9} + 1 \times \frac{2}{9} = \frac{2}{9}$$
要点:此例展示了二维离散型分析的标准流程。边际分布通过对联合表逐行/逐列求和得到。独立性检验只需找到一对不满足乘积分解的取值即可否定。函数 $Z=g(X,Y)$ 的分布需要对联合取值逐项映射并合并相同值。期望可以利用函数分布直接计算($E(XY) = EZ$),无需分别求 $EX$$EY$ 再相乘。
五、金融与经济学应用线索
五、金融与经济学应用线索

1. 投资组合风险:多资产收益率构成随机向量,协方差矩阵决定组合方差 $w'\Sigma w$。分散化的效果来自资产之间协方差较低或为负。

2. Copula 与市场联动:联合分布可分解为边际分布和关联函数。金融中可用 copula 分离单个资产收益的边际行为与资产之间的相依结构。

3. 回归与预测:条件均值 $E(Y|X)$ 是最优 MSE 预测函数,是计量经济学中回归函数的概率论形式。工资差异、消费函数和收入预测都可表述为条件均值问题。

4. 有效市场假说:若 $Y_t$ 为资产收益率,$I_{t-1}$ 为上一期信息,有效市场可写为 $E(Y_t|I_{t-1})=E(Y_t)$,即历史信息不能改进对未来收益均值的预测。

5. 风险管理:VaR 和 Expected Shortfall 都是条件分布思想的应用。期望损失 $ES_t(\alpha)=-E[X_t|X_t<-V_t(\alpha)]$ 用危机发生条件下的平均损失衡量尾部风险。

6. 条件异方差:金融市场收益常有波动聚类,即大波动后仍可能大波动。ARCH/GARCH 模型通过条件方差刻画这种动态风险结构。

六、学习提示与易错点
六、学习提示与易错点

第一,联合分布和边际分布的方向要分清。联合分布是从两个变量的共同取值出发,边际分布是把其中一个变量消去以后得到的单变量分布。很多初学者会误以为知道两个边际分布就等于知道联合分布,这在概率论中通常不成立。两个变量的边际形状完全相同,仍可能有完全不同的相依结构。金融中的一个直观例子是:两只资产各自收益率分布相同,但它们可能同涨同跌,也可能此消彼长;这两种情形的投资组合风险显然不同。

第二,连续条件分布中的“给定 $X=x$”不能机械套用事件条件概率。连续变量满足 $P(X=x)=0$,所以条件 PDF 的定义本质上是密度比 $f_{XY}(x,y)/f_X(x)$,可以理解为在 $X$ 落入 $x$ 附近很小区间时的极限分布。这个理解有助于避免“零概率事件为什么还能条件化”的困惑。

第三,独立、不相关、因果关系是三个层级不同的概念。独立是完整分布层面的无相依,不相关只是线性矩层面的零关系,因果关系还需要干预、识别假设或结构模型。统计上看到 $\rho=0$ 只能说明线性相关为零,不能说明没有任何关系;看到 $\rho\ne0$ 也不能说明存在因果机制。

第四,多元正态分布是特殊而强大的模型。它的边际、条件和线性变换仍为正态,使大量推导可以闭合;但反过来,边际正态并不保证联合正态。课件反例说明,即使 $X$$Y$ 分别服从标准正态,只要联合密度被限制在同号象限,它们就不服从二元正态。判断联合正态必须看整体联合结构。

第五,条件期望是回归思想的概率基础。$E(Y|X)$ 不是普通常数均值,而是随 $X$ 改变的函数;它在均方误差意义下给出最优预测。线性回归只是在进一步假设或近似下,把这个函数限制为 $a+bX$。因此,理解条件期望比直接背回归公式更根本。

第六,条件方差提供了比条件均值更进一步的信息。在经济和金融数据中,均值关系可能较弱,但波动关系很强。例如资产收益率均值难以预测,波动却常有聚集性。此时建模对象就从 $E(Y_t|I_{t-1})$ 转向 $var(Y_t|I_{t-1})$,这也是 ARCH/GARCH 模型的出发点。

第七,做题时建议按“支撑先行”的顺序展开。无论求边际、条件还是变换后的分布,第一步都应画出或写出联合支撑;第二步再判断积分上下限或求和范围;第三步才代入公式。许多错误并非来自公式记错,而是来自支撑区域处理错误。尤其在三角区域、圆盘区域、变量和差变换中,积分限往往随给定变量变化。若能先把随机点所在区域和目标事件区域分清,后续计算会稳定很多。

第八,学习本章应把“分布、矩、预测”连成一条线。联合分布是最完整对象,边际和条件分布是从联合分布派生出来的;期望、方差、协方差和相关系数是对分布的摘要;条件期望和条件方差则是预测均值与预测风险的摘要。计量经济学中很多模型可以视为选择某个条件矩进行建模:线性回归建模条件均值,ARCH 建模条件方差,风险管理有时需要直接建模条件尾部分布。

七、复习速查表
七、复习速查表
主题核心公式含义
联合 CDF$F_{XY}(x,y)=P(X\le x,Y\le y)$描述随机向量整体分布
边际 CDF$F_X(x)=F_{XY}(x,\infty)$从联合分布提取单变量分布
离散边际 PMF$f_X(x)=\sum_y f_{XY}(x,y)$对另一个变量求和
连续边际 PDF$f_X(x)=\int f_{XY}(x,y)dy$对另一个变量积分
条件 PMF/PDF$f_{Y|X}(y|x)=f_{XY}(x,y)/f_X(x)$给定 $X=x$$Y$ 的分布
乘法法则$f_{XY}=f_{Y|X}f_X$联合分布可由边际与条件分布构成
独立性$f_{XY}=f_Xf_Y$知道一个变量不改变另一个变量分布
协方差$cov(X,Y)=E(XY)-E(X)E(Y)$线性联动方向与强度的未标准化度量
相关系数$\rho=cov(X,Y)/(\sigma_X\sigma_Y)$标准化线性相关,范围 $[-1,1]$
独立与不相关独立 $\Rightarrow cov=0$,反向一般不成立不相关只排除线性关系
二元正态条件均值$E(Y|X)=\mu_2+\rho\frac{\sigma_2}{\sigma_1}(X-\mu_1)$正态条件均值为线性函数
二元正态条件方差$var(Y|X)=\sigma_2^2(1-\rho^2)$条件同方差,$|\rho|$ 越大剩余方差越小
迭代期望$E[g(X,Y)]=E\{E[g(X,Y)|X]\}$先条件平均,再对条件变量平均
条件方差公式$var(Y|X)=E(Y^2|X)-[E(Y|X)]^2$条件波动计算公式
方差分解$var(Y)=var[E(Y|X)]+E[var(Y|X)]$总波动=可预测波动+不可预测波动
线性变换$AX+b\sim N(A\mu+b,A\Sigma A')$多元正态族在线性变换下封闭

本章的学习重点不是机械记忆大量公式,而是掌握三层关系:联合分布给出完整信息,边际分布只看单变量,条件分布描述预测关系。协方差和相关系数是条件与联合信息的低维摘要,独立性是最强的无相依关系,多元正态分布则是把这些概念连接起来的标准模型。

参考来源

  • 洪永淼《概率论与统计学》第5章课件(厦门大学WISE,2024)