嵌入式智能系统与新型计算架构
西安交通大学 · 任鹏举教授
从硅片到系统,从串行到并行,从通用到专用——逐讲拆解计算机体系结构的核心脉络
Introduction · 课程说明
课程概览
本课程由西安交通大学人工智能与机器人研究所任鹏举教授主讲,面向计算机体系结构方向的高年级本科生与研究生。课程核心目标是建立"从应用到物理"的系统观:理解算法需求如何驱动架构设计,制造技术如何约束架构选择,以及软硬件协同如何在多层抽象之间架起桥梁。
参考教材为 Computer Systems: A Programmer's Perspective(CS:APP,深入理解计算机系统)第三版。先修课程:数字系统结构、计算机组成原理。
📚 讲次索引
第 02 讲
核心问题:2004 年之后,让程序变快的答案从"等下一代 CPU"变成了什么?
- 功耗墙与 Dennard 缩放
- ILP / DLP / TLP 概览
- 并行加速比与 Amdahl 定律
第 03 讲 · 下
核心问题:GPU 有几千个"核心",为什么写 CUDA 代码比写 C 代码复杂得多?
- SIMT vs SIMD
- CUDA 线程模型
- GPU 内存层级与优化
第 06 讲
核心问题:FPGA "编程"和写 C 代码有什么区别?为什么 AI 推理加速器爱用 FPGA?
- FPGA 架构基础
- LUT / CLB / 互连
- CGRA 与数据流
📖 参考资源
| 资源 | 类型 | 说明 |
|---|---|---|
| Computer Systems: A Programmer's Perspective 3rd Ed. | 教材 | CS:APP,深入理解计算机系统,本课程参考教材 |
| Hennessy & Patterson Computer Architecture | 教材 | 计算机体系结构经典教材,量化方法 |
| 算力系统全景 | 综述 | 本博客的算力系统架构全面指南,可作为课程预习/复习材料 |
| 课程课件 L01–L06 | PPT/PDF | 西安交通大学任鹏举教授课程讲义,见各讲笔记引用 |
🗺️ 学习路径建议
路径一:按讲次顺序
路径二:问题导向
🔗 相关文章
- 算力系统全景:从芯片到存储的完整指南 — 课程内容的综合综述