ESC
输入关键词搜索文章
目录

AI Infra 系列

现代 AI 系统的分层地图
从硬件到治理,理解支撑 AI 运行的完整基础设施
系列总纲
关于这个系列

AI Infra(AI Infrastructure)是支撑 AI 系统从数据接入、模型训练、模型部署、在线推理到观测治理全过程的底层技术与工程系统。本系列试图回答的不是“某个模型怎么工作”,而是“为什么今天的 AI 需要一套新的基础设施语言”。

系列先从推理 Infra 切入——这是当前创新最密集、也最能暴露系统矛盾的一层——再逐步扩展到训练、数据与平台治理,最后回到一张完整的 AI 基础设施地图。

📚 章节目录
排序:

文章关系图

15 篇文章 · 22 条连接

🗺️ 阅读路径建议

路径一:推理主线(推荐优先)

01 → 02 → 03 → 04 → 05。从总纲出发,先建立推理系统语言,再深入 KV cache 与调度器,比较 vLLM 和 SGLang 的设计取舍,最后以 SGLang Omni 的多模态案例收束。

路径二:训练与数据

01 → 06 → 07。在理解全景后,转向训练系统的分布式协同问题,再延伸到数据供应链与知识接入层。

路径三:平台与运营视角

01 → 08。如果你更关心 AI 系统的长期运营、可观测性和治理,可以直接跳到平台层。

📚 参考来源

来源类型说明
IBM Think官方定义AI infrastructure 企业级定义
vLLM开源项目PagedAttention、推理吞吐优化
SGLang / SGLang-Omni开源项目RadixAttention、multi-stage inference
DeepSpeed / ZeRO开源项目分布式训练显存优化
Megatron-LM开源项目大规模 Transformer 模型并行
NVIDIA NCCL系统库GPU 高性能集合通信
CNCF / llm-d基金会项目Kubernetes-native AI serving
OpenTelemetry观测标准GenAI 可观测性语义约定

📋 待扩展专题

专题状态优先级
AI Infra 开源版图索引待整理
成本优化与 FinOps for AI待研究
边缘推理与端侧部署待研究