ESC
输入关键词搜索文章
目录

LoRA 训练完全指南

从原理到实践的系统性指南
数学原理 · 适用结构 · 代码实现 · 生态选型
为什么这个系列值得从头看一遍

LoRA(Low-Rank Adaptation)已经从一篇参数高效微调论文,演变成今天大模型训练与适配里的事实标准方法之一。它不只是一个公式,也是一整套从理论、模块选择、代码实现到工具链分层的工程体系。

本页是整个系列的枢纽入口。你可以把它当作目录,也可以把它当作一页速查卡:先看全景,再决定自己该从哪一篇开始。

📚 系列目录
核心速查

LoRA 核心公式

$$h = W_0 x + \frac{\alpha}{r}BAx$$

其中 $W_0$ 是冻结的预训练权重,$A$$B$ 是低秩可训练矩阵。这个公式背后隐含的假设是:下游任务真正需要学习的更新,往往远低于完整参数空间维度 #Hu et al., 2021 #Aghajanyan et al., 2021

问题一句话答案去哪里看
LoRA 为什么有效?因为有效更新常落在低维子空间里系列一
$r$ 怎么选?从 4 或 8 起步,按任务复杂度逐步提高系列一
哪些层最值得插 LoRA?Attention 重要,但 FFN 往往同样关键系列二
手写 LoRA 有什么意义?帮助理解 merge、初始化与参数量缩减逻辑系列二
大模型显存不够怎么办?走 QLoRA 路线:PEFT + bitsandbytes系列一 / 系列三
第一次实战用什么工具?先用 LLaMA-Factory 或 PEFT,再考虑 Unsloth系列三
建议阅读顺序

三步路线

  1. 先立原理:读 系列一,知道 LoRA 不是“玄学省参数”,而是低秩更新假设的工程化实现。
  2. 再看结构与实现:读 系列二,把理论落到模块与代码。
  3. 最后做工具选型:读 系列三,把“能不能训”转换成“该怎么训”。

参考来源

  • Hu, E. J. et al. (2021). LoRA: Low-Rank Adaptation of Large Language Models. arXiv:2106.09685
  • Aghajanyan, A. et al. (2021). Intrinsic Dimensionality Explains the Effectiveness of Language Model Fine-Tuning. ACL 2021. arXiv:2012.13255