动手学大模型 Dive-Into-LLMs

2026/05/19 13:48:30·2026/05/20 14:00:00

项目背景

关于本教程

《动手学大模型》由上海交通大学《自然语言处理前沿技术》（NIS8021）与《人工智能安全技术》（NIS3353）课程讲义拓展而来，主讲教师张倬胜。教程属公益性质、完全免费，旨在通过简单实践帮助快速入门大模型，开展课程设计或学术研究。

教程涵盖从模型微调到安全对齐的全栈技能，分为核心实践、安全对齐、多模态与 Agent 三大模块。所有代码均可在本机运行，每章配有完整的 Jupyter Notebook 实验环境。

索引

教程目录

章节卡片

章节速览

虚假新闻检测实践。解耦版本（模块清晰）与集成版本（直接运行）两条路径。Gradio Spaces 在线部署。

零样本/少样本提示范式，CoT 思维链推理，PoT 程序思维，自洽性采样，ReAct 推理+行动循环。

EasyEdit 统一框架，ROME 单条编辑，MEMIT 批量编辑。评估四性：可靠性、通用性、局部性、可移植性。

DeepSeek-R1 数据蒸馏流程。DeepMath-103K + Qwen2.5-Math-1.5B，从数据预处理到模型评测全流程。

KGW 统计水印算法，z-score 检测。AUC 接近 100%。鲁棒性挑战：paraphrase 和 translation 会降低检测能力。

EasyJailbreak 框架，11 种越狱方法。知己知彼，理解攻击是做好防御的前提。

霍夫曼编码 + GPT-2，在正常文本中隐藏秘密信息。解码后信息可完整提取，表面完全不可感知。

MLLM 两大架构，NExT-GPT "任意到任意"模态系统，ImageBind + Vicuna + 扩散模型解码器，三阶段训练。

Qwen2-VL-7B + OS-Kairos，"看懂截图 + 预测操作"的 Agent。全量 SFT，3×80GB A100 硬件要求。

R-Judge 评测框架，7 大领域 27 场景。评测 Agent 在开放场景中的风险识别与安全判断能力。

PPO 三步循环（Rollout→Evaluation→Optimization），BERT 情感分类器替代人工反馈，KL 正则化约束。

扩展内容

国产化《大模型开发全流程》

联合华为昇腾社区推出的系列课程，基于昇腾基础软硬件开发，覆盖 PPT、实验手册、视频等教程形式。分为初级、中级、高级三个系列。

技术版图

涉及的主要技术与工具