关于

📝 个人简介

具备生成式AI与计算机视觉相关项目经验，熟悉从数据处理、模型训练到效果优化的完整流程，能够从零实现扩散模型训练与推理框架，并具备多卡机器训练经验。拥有中法双学位与海外实习经历，能够在跨文化环境中高效协作。关注扩散模型与图像、视频生成及压缩方向，兼顾研究探索与业务落地。目前在阿里巴巴钉钉实习，负责数字人方向的算法与工程工作。

👤 个人信息

📱	电话	150 7938 0535
📧	邮箱	3193603347@qq.com
📍	地址	陕西省西安市西咸新区西安交通大学创新港校区惠园

💻 技术栈

	Python	PyTorch · 扩散模型 · LoRA微调 · Transformer	⭐⭐⭐⭐
	C/C++	系统编程 · 嵌入式开发	⭐⭐⭐⭐
🖼️	计算机视觉	OpenCV · YOLO · 图像分割 · 关键点检测	⭐⭐⭐⭐
🎨	AIGC 工具	ComfyUI · Stable Diffusion · 视频生成	⭐⭐⭐⭐
🧠	Linux · Git	Arch / Ubuntu · 版本控制 · 多卡训练	⭐⭐⭐⭐⭐
📄	LaTeX · Emacs	学术写作 · 环境配置	⭐⭐⭐⭐

🌍 语言

🇨🇳	中文	母语	⭐⭐⭐⭐⭐
🇬🇧	英语	CET6 · 学术读写	⭐⭐⭐⭐
🇫🇷	法语	DELF C1 · 法语授课环境	⭐⭐⭐⭐

🎓 教育背景

2025.09 — 至今

西安交通大学 · 陕西西安

硕士在读 · 人机所 · 人工智能专业 · 获一等学业奖学金，推免录取
研究方向：基于扩散模型或自回归模型的生成式图像与视频压缩

2023.09 — 2025.07

法国中央理工大学（双学位）· 里尔

通用工程师学位

2021.09 — 2025.07

西安交通大学 · 陕西西安

本科 · 人工智能专业 · GPA 89.68/100，专业前 30%
核心课程：深度学习、计算机视觉、强化学习、机器学习、模式识别、嵌入式系统

💼 专业经历

2026.06 — 至今

阿里巴巴钉钉 · 数字人方向实习生

负责数字人方向相关工作，围绕实时数字人、音视频交互与生成式模型落地，参与算法方案调研、工程实现和效果优化。

2025.11 — 2026.02

北京零一智能科技有限公司 · 算法实习生

基于 EasyAnimate（Video-DiT）采用 CatV2TON + LiON-LoRA 方案微调，通过清洗企业闭源数据优化训练策略，提升 VideoTryOn 模型的动作、服装细节一致性，产出可用于生产的图像换装模型。

基于 ComfyUI 搭建端到端视频换装流程。使用 Nano Banana 与 ChatGPT 设计复杂材质衣物镂空图生成提示词，将生成成功率提升至 99% 以上。

2024.05 — 2024.08

Groupe Bouygues · 研究性实习 · 法国巴黎

开发基于 AI 视频理解的工地智能安全头盔系统，结合实地调研识别 8 类主要风险场景。

参考 ST-GCN 与 SkateFormer 等骨架序列建模方法，采用 YOLOv5s-pose 提取人体关键点，结合 Transformer 架构对时序与空间关系联合建模，企业数据集上风险场景分类准确率达 94%。

基于 Arduino + ESP32-CAM 实现硬件原型，集成边缘计算模块。

2024.02 — 2024.03

LamCube · 研究性实习

围绕建筑裂缝智能检测开展研究，调研 50 余篇文献，采用 Deeplabv3+ 语义分割方案，实验室数据集 IoU 达 0.84。

基于 YOLO 实现实时车道线检测、行人检测及车标检测，结合 Arduino 与嵌入式 GPU 平台完成自动驾驶小车原型搭建。

🔬 科研经历

2024.09 — 2025.06

基于矢量量化与生成模型的图像压缩方法研究

对 VQVAE、RVQ、FSQ 等量化编码器及 MaskGIT、MAE 的 ROI 区域图像编解码进行调研。

结合 Stable Diffusion、HyperPrior 熵编码与传统图像处理方法设计压缩方案，实现 500 倍以上压缩比（0.002 bpp）。

🏛️ 校园活动

🎭 国际学生联合会主席

里尔中央理工学院 · 2024–2025

💰 中国学生联合会会计

里尔中央理工学院 · 2024–2025

🌏 学生会国际生代表

里尔中央理工学院 · 2024–2025