数字人工程解读(四):实时数字人模型推理 Benchmark 汇总
本页定位:这是"数字人工程解读系列"的实验数据汇总页。表格记录各开源实时数字人工程在真实 GPU 上跑出的推理 FPS、显存占用与消耗百分比,供选型与排障参考。数据来源均为系列文章中的实测日志或用户提供的 nvidia-smi 截图。
Benchmark
实时数字人模型推理数据
| 模型 | 效果(视频) | 推理速度(FPS) | 显存占用 | 显存消耗(nvidia-smi) |
|---|---|---|---|---|
| LiteAvatar OpenAvatarChat · A10 |
待补充 | 25.19 | 7507 MiB / 23028 MiB | ≈32.5%(三进程合计 7488 MiB) |
| LAM OpenAvatarChat · A10 |
待补充 | 30(arkit_face 30帧/秒) | 1725 MiB / 23028 MiB | ≈7.5%(单进程 1716 MiB) |
| SoulX-FlashHead-1_3B Lite CyberVerse · A10 · wav2vec2-base-960h |
待补充 | ≈46.7(24帧/0.514s) | 待补充 | 待补充 |
| FlashHead 1.3B Pro CyberVerse · A10 |
待补充 | ≈4.8(28帧/5.82s, 512×512) | 7839 MiB / 23028 MiB | ≈34.0%(GPU-Util 100%, 148W/150W) |
| LiveAct 18B CyberVerse · A10 |
— | 不可用(OOM / 超时) | >23028 MiB | — |
| LiveAct 18B CyberVerse · RTX PRO 6000(源码报告) |
待补充 | 20 | 待补充 | 待补充 |
注:除特别标注外,所有 FPS 数据均在单张 NVIDIA A10(24GB)上测得。FPS 列为 Avatar 模型本身的视频帧生成速度,不含 ASR/LLM/TTS/WebRTC 等链路开销。"待补充"表示该条目尚未在当前实验中采集到对应数据。
数据来源
- LiteAvatar / A10:用户提供 2026-06-16 16:18 OpenAvatarChat 运行日志 + nvidia-smi 输出。#openavatarchat-a10-log-2026-06-16
- LAM / A10:用户提供 2026-06-16 16:27 OpenAvatarChat LAM 推理日志 + nvidia-smi 输出。#openavatarchat-lam-a10-log-2026-06-16
- FlashHead Lite:数字人工程解读(二):CyberVerse 实验记录——FlashHead Lite + wav2vec2 的端到端耗时拆解 中的 Python Avatar 生成日志。#cyberverse-flashhead-experiment
- FlashHead Pro / A10:用户提供 2026-06-16 17:35 CyberVerse FlashHead Pro 推理日志 + nvidia-smi 输出(A10, 512×512)。#cyberverse-flashhead-pro-a10-log-2026-06-16
- LiveAct:数字人工程解读(一):CyberVerse,把论文拼成一个能对话的实时数字人 第六章硬件 benchmark 表。#cyberverse-source-read
参考来源
- OpenAvatarChat LiteAvatar A10 运行日志与 nvidia-smi 输出(2026-06-16 16:18)。用户提供原始数据。
- OpenAvatarChat LAM A10 推理日志与 nvidia-smi 输出(2026-06-16 16:27)。用户提供原始数据。
- CyberVerse 本地实验日志(2026-06-12):SoulX-FlashHead-1_3B Lite + wav2vec2-base-960h Avatar 生成耗时。见 数字人工程解读(二)。
- CyberVerse FlashHead 1.3B Pro A10 推理日志与 nvidia-smi 输出(2026-06-16 17:35)。用户提供原始数据,512×512 分辨率。
- CyberVerse 源码解读(2026-06-05):README 硬件 benchmark 表。见 数字人工程解读(一)。