高级机器学习
课程笔记中枢页 · 西安交通大学 · 魏平
从经典机器学习的数理骨架,走到深度模型与注意力机制
9页面笔记
576课件页数
3知识主线
1考核指南
Overview · 组织说明
这套笔记怎么读
这组页面围绕《高级机器学习》课程的 8 讲课件与 1 份考核说明展开。它不按“背结论”的方式拆课,而是尽量把整门课重新整理成一条从经典统计学习走向深度表示学习的连续链路:先问什么叫学习,再看线性判别与概率生成,然后进入集成、稀疏、采样,最后抵达神经网络与注意力模型。
主线:先定义学习问题 → 再理解判别式与生成式建模 → 再看高维稀疏与随机近似 → 最后进入深度表示与注意力结构。
前置知识回顾
- 线性代数:向量、矩阵、特征分解。作用:支撑线性模型、SVD、注意力矩阵计算。
- 概率论:条件概率、期望、方差、随机变量。作用:支撑贝叶斯分类与采样方法。
- 优化方法:凸优化、拉格朗日乘子、梯度下降。作用:支撑 SVM、逻辑回归、神经网络训练。
- 信号与系统:若理解压缩感知,会更容易把“稀疏表示”看成结构假设而非技巧。
🧭 讲次索引
🗺️ 三条复习主线
主线一:什么叫学习
主线二:高维问题怎么做近似
主线三:表示学习如何接管主场
📚 参考来源
- 西安交通大学《高级机器学习》课程课件(25C01–25C09)
- Christopher Bishop, Pattern Recognition and Machine Learning
- Ian Goodfellow, Yoshua Bengio, Aaron Courville, Deep Learning
- D2L, scikit-learn 文档,以及公开课程讲义,用于补足定义、推导直觉和现代术语