ESC
输入关键词搜索文章
目录

概率论与统计学

XMU WISE · 课程笔记
从随机试验到大数据,统计思维的核心框架
Introduction · 课程说明
课程概述

概率论与统计学是理解不确定性、进行推断决策的核心工具。本课程由厦门大学王亚南经济研究院(WISE)提供,2024年12月版课件共12章,从概率论基础出发,覆盖随机变量、多元分布、统计抽样、参数估计、假设检验,最终延伸至经典线性回归与机器学习。

本中枢页锚定课程分期框架与课件资源,供系统学习和复习参考使用。

📅 章节结构
第 1 章
导论——经济学研究的基本方法论

现代经济学研究的两大公理与统计流程。恩格尔曲线、菲利普斯曲线、波动聚类等代表性实例展示统计规律性在经济现象中的体现。

关键问题:为什么经济学需要概率思维?统计学的任务是什么?

  • 经济学研究的两大基本公理
  • 统计研究的基本流程
  • 代表性实例(恩格尔曲线、菲利普斯曲线、波动聚类)

📖 阅读笔记 →

第 2 章
概率论基础

从随机试验到概率空间的公理化体系。样本空间、σ代数、概率函数、条件概率、全概率公式、贝叶斯定理与独立性。

关键问题:概率的频率解释与主观解释有何本质区别?贝叶斯定理如何连接先验与后验?

  • 随机试验、样本空间与事件
  • 概率空间与事件域
  • 条件概率与独立性
  • 贝叶斯定理

📖 阅读笔记 →

第 3 章
随机变量与一元概率分布

从样本空间到实数轴的映射,建立一元概率分布的完整工具链:CDF、PMF/PDF、矩、分位数、矩生成函数与特征函数,共11节。

关键问题:如何根据数据特征选择合适的概率分布模型?MGF 和特征函数各自的优势是什么?

  • 随机变量、CDF、PMF/PDF
  • 随机变量的函数与变换法
  • 期望、方差、偏度、峰度
  • 分位数与风险价值(VaR)
  • 矩生成函数与特征函数

📖 阅读笔记 →

第 4 章
重要概率分布

系统梳理13种重要概率分布:从伯努利到正态,从离散到连续,覆盖定义、参数含义、期望方差与经济学应用。

关键问题:如何根据数据特征选择合适的概率分布模型?分布的参数如何影响分布形态?

  • 重要离散分布(伯努利、二项、泊松、几何、超几何、负二项)
  • 重要连续分布(正态、指数、均匀、伽马、对数正态、威布尔、贝塔)
  • 分布之间的关系与近似
  • MGF 与特征函数速记

📖 阅读笔记 →

第 5 章
多元随机变量

处理多个随机变量的联合分析与相关性。引入多元正态分布、协方差矩阵、边缘分布与条件分布,以及随机变量变换的一般方法。

关键问题:多元情形下,如何量化变量之间的相关性?条件分布在统计推断中扮演什么角色?

  • 联合分布与边缘分布
  • 条件分布与条件期望
  • 协方差与相关系数
  • 多元正态分布
  • 随机向量变换

📖 阅读笔记 →

第 6–7 章
抽样理论与极限定理

连接概率论与统计推断的桥梁。第六章介绍统计抽样理论、常用抽样分布($t$$\chi^2$$F$);第七章深入大数定律与中心极限定理,为参数估计提供理论基础。

关键问题:中心极限定理为何如此重要?样本量足够大时,统计量的分布收敛由什么决定?

  • 简单随机抽样
  • 样本均值与样本方差的分布
  • $\chi^2$$t$$F$ 分布
  • 大数定律(弱大数定律、强大数定律)
  • 中心极限定理

📖 阅读笔记 →

第 8–9 章
参数估计与假设检验

统计推断的两大核心方法。第八章覆盖点估计(矩估计、极大似然估计)与区间估计;第九章建立假设检验框架,包括检验的构建逻辑、两类错误与$p$值的意义。

关键问题:极大似然估计为何在渐近意义上效率最优?$p$值是否等同于"原假设为真的概率"?

  • 点估计:矩估计与极大似然估计
  • 估计量的无偏性、有效性、一致性
  • 置信区间与预测区间
  • 假设检验框架
  • 两类错误(Type I / Type II)
  • $p$ 值与显著性水平
  • 似然比检验

📖 阅读笔记 →

第 10–12 章
回归分析与前沿扩展

从经典线性回归到机器学习前沿。第十章系统讲解一元与多元线性回归;第十一章探讨大数据与机器学习对传统统计学的挑战与融合;第十二章回顾课程整体框架。

关键问题:线性回归的最小二乘估计与极大似然估计之间有何联系?机器学习方法在什么场景下优于传统统计方法?

  • 一元线性回归
  • 多元线性回归与矩阵表示
  • 最小二乘估计与几何解释
  • 回归显著性检验
  • 统计学与机器学习的边界与融合

📖 阅读笔记 →

📚 课件资源
章节文件名页数状态
第 1 章 · 引言/media/概率论/01.引言.pdf55✅ 已下载
第 2 章 · 概率论与统计学/media/概率论/02.概率论与统计学.pdf124✅ 已下载
第 3 章 · 随机变量和一元概率分布/media/概率论/03.随机变量和一元概率分布.pdf193✅ 已下载
第 4 章 · 重要概率分布/media/概率论/04.重要概率分布.pdf99✅ 已下载
第 5 章 · 多元随机变量及其概率分布/media/概率论/05.多元随机变量及其概率分布.pdf287✅ 已下载
第 6 章 · 统计抽样理论导论/media/概率论/06.统计抽样理论导论.pdf152✅ 已下载
第 7 章 · 收敛和极限定理/media/概率论/07.收敛和极限定理.pdf133✅ 已下载
第 8 章 · 参数估计和评估/media/概率论/08.参数估计和评估.pdf212✅ 已下载
第 9 章 · 假设检验/media/概率论/09.假设检验.pdf103✅ 已下载
第 10 章 · 经典线性回归分析/media/概率论/10.经典线性回归分析.pdf177✅ 已下载
第 11 章 · 大数据、机器学习与统计学/media/概率论/11.大数据、机器学习与统计学.pdf60✅ 已下载
第 12 章 · 结论/media/概率论/12.结论.pdf25✅ 已下载

课件来源

厦门大学王亚南经济研究院(WISE)概率论与统计学课程网站。
发布时间:2024年12月30日。如需 PPTX 格式,请联系作者:ymhong@amss.ac.cn

🗺️ 学习路径
路径一:理论优先

先掌握概率论基础(第1–5章),再深入抽样理论与极限定理(第6–7章),最后学习推断方法(第8–9章)。适合追求严谨理论框架的学习者。按序学习总时长约 4–6 周。

路径二:应用优先

从与现实关联最紧密的假设检验(第9章)和回归分析(第10章)入手,遇到理论障碍时再回溯查读第3–4章和第6章。适合有一定直觉但缺乏系统训练的学习者。总时长约 3–5 周。

📋 待研究专题
专题来源章节状态优先级
第1章:经济学研究方法论与统计流程第 1 章✅ 已完成
第2章:概率论基础(概率空间、条件概率、贝叶斯)第 2 章✅ 已完成
第3章:随机变量与一元概率分布(含矩、分位数、MGF、特征函数)第 3 章✅ 已完成
第4章:重要概率分布详解第 4 章✅ 已完成
多元正态分布与协方差矩阵第 5 章✅ 已完成
三大抽样分布的推导与应用第 6 章✅ 已完成
大数定律与中心极限定理的直观理解第 7 章✅ 已完成
极大似然估计的渐近理论第 8 章✅ 已完成
假设检验的两类错误与功效函数第 9 章✅ 已完成
线性回归矩阵形式与诊断第 10 章✅ 已完成
统计学与机器学习的边界与融合第 11 章✅ 已完成