ESC
输入关键词搜索文章
目录

关于

郑鑫裕 · ZHENG Xinyu
西安交通大学人机所 · 生成式AI / 计算机视觉 / 多模态算法研究
Profile

您好!👋 我叫郑鑫裕,就读于西安交通大学及里尔中央理工学院,爱好语言、编程以及文学。

📝 个人简介

具备生成式AI与计算机视觉相关项目经验,熟悉从数据处理、模型训练到效果优化的完整流程,能够从零实现扩散模型训练与推理框架,并具备多卡机器训练经验。拥有中法双学位与海外实习经历,能够在跨文化环境中高效协作。关注扩散模型与图像、视频生成及压缩方向,兼顾研究探索与业务落地。目前在阿里巴巴钉钉实习,负责数字人方向的算法与工程工作。

👤 个人信息

📱 电话 150 7938 0535
📧 邮箱 3193603347@qq.com
📍 地址 陕西省西安市西咸新区西安交通大学创新港校区惠园

💻 技术栈

Python Python PyTorch · 扩散模型 · LoRA微调 · Transformer ⭐⭐⭐⭐
CPP C/C++ 系统编程 · 嵌入式开发 ⭐⭐⭐⭐
🖼️ 计算机视觉 OpenCV · YOLO · 图像分割 · 关键点检测 ⭐⭐⭐⭐
🎨 AIGC 工具 ComfyUI · Stable Diffusion · 视频生成 ⭐⭐⭐⭐
🧠 Linux · Git Arch / Ubuntu · 版本控制 · 多卡训练 ⭐⭐⭐⭐⭐
📄 LaTeX · Emacs 学术写作 · 环境配置 ⭐⭐⭐⭐

🌍 语言

🇨🇳 中文 母语 ⭐⭐⭐⭐⭐
🇬🇧 英语 CET6 · 学术读写 ⭐⭐⭐⭐
🇫🇷 法语 DELF C1 · 法语授课环境 ⭐⭐⭐⭐

🎓 教育背景

2025.09 — 至今
西安交通大学 · 陕西西安
硕士在读 · 人机所 · 人工智能专业 · 获一等学业奖学金,推免录取
研究方向:基于扩散模型或自回归模型的生成式图像与视频压缩
2023.09 — 2025.07
法国中央理工大学(双学位)· 里尔
通用工程师学位
2021.09 — 2025.07
西安交通大学 · 陕西西安
本科 · 人工智能专业 · GPA 89.68/100,专业前 30%
核心课程:深度学习、计算机视觉、强化学习、机器学习、模式识别、嵌入式系统

💼 专业经历

2026.06 — 至今
阿里巴巴钉钉 · 数字人方向实习生

负责数字人方向相关工作,围绕实时数字人、音视频交互与生成式模型落地,参与算法方案调研、工程实现和效果优化。

2025.11 — 2026.02
北京零一智能科技有限公司 · 算法实习生

基于 EasyAnimate(Video-DiT)采用 CatV2TON + LiON-LoRA 方案微调,通过清洗企业闭源数据优化训练策略,提升 VideoTryOn 模型的动作、服装细节一致性,产出可用于生产的图像换装模型。

基于 ComfyUI 搭建端到端视频换装流程。使用 Nano Banana 与 ChatGPT 设计复杂材质衣物镂空图生成提示词,将生成成功率提升至 99% 以上。

2024.05 — 2024.08
Groupe Bouygues · 研究性实习 · 法国巴黎

开发基于 AI 视频理解的工地智能安全头盔系统,结合实地调研识别 8 类主要风险场景。

参考 ST-GCN 与 SkateFormer 等骨架序列建模方法,采用 YOLOv5s-pose 提取人体关键点,结合 Transformer 架构对时序与空间关系联合建模,企业数据集上风险场景分类准确率达 94%。

基于 Arduino + ESP32-CAM 实现硬件原型,集成边缘计算模块。

2024.02 — 2024.03
LamCube · 研究性实习

围绕建筑裂缝智能检测开展研究,调研 50 余篇文献,采用 Deeplabv3+ 语义分割方案,实验室数据集 IoU 达 0.84。

基于 YOLO 实现实时车道线检测、行人检测及车标检测,结合 Arduino 与嵌入式 GPU 平台完成自动驾驶小车原型搭建。

🔬 科研经历

2024.09 — 2025.06
基于矢量量化与生成模型的图像压缩方法研究

对 VQVAE、RVQ、FSQ 等量化编码器及 MaskGIT、MAE 的 ROI 区域图像编解码进行调研。

结合 Stable Diffusion、HyperPrior 熵编码与传统图像处理方法设计压缩方案,实现 500 倍以上压缩比(0.002 bpp)。

🏛️ 校园活动

🎭 国际学生联合会主席
里尔中央理工学院 · 2024–2025
💰 中国学生联合会会计
里尔中央理工学院 · 2024–2025
🌏 学生会国际生代表
里尔中央理工学院 · 2024–2025