数字人工程解读（四）：实时数字人模型推理 Benchmark 汇总

2026/06/16 16:26:19

本页定位：这是"数字人工程解读系列"的实验数据汇总页。表格记录各开源实时数字人工程在真实 GPU 上跑出的推理 FPS、显存占用与消耗百分比，供选型与排障参考。数据来源均为系列文章中的实测日志或用户提供的 nvidia-smi 截图。

Benchmark

实时数字人模型推理数据

模型	效果（视频）	推理速度（FPS）	显存占用	显存消耗（nvidia-smi）
LiteAvatar OpenAvatarChat · A10	待补充	25.19	7507 MiB / 23028 MiB	≈32.5%（三进程合计 7488 MiB）
LAM OpenAvatarChat · A10	待补充	30（arkit_face 30帧/秒）	1725 MiB / 23028 MiB	≈7.5%（单进程 1716 MiB）
SoulX-FlashHead-1_3B Lite CyberVerse · A10 · wav2vec2-base-960h	待补充	≈46.7（24帧/0.514s）	待补充	待补充
FlashHead 1.3B Pro CyberVerse · A10	待补充	≈4.8（28帧/5.82s, 512×512）	7839 MiB / 23028 MiB	≈34.0%（GPU-Util 100%, 148W/150W）
LiveAct 18B CyberVerse · A10	—	不可用（OOM / 超时）	>23028 MiB	—
LiveAct 18B CyberVerse · RTX PRO 6000（源码报告）	待补充	20	待补充	待补充

注：除特别标注外，所有 FPS 数据均在单张 NVIDIA A10（24GB）上测得。FPS 列为 Avatar 模型本身的视频帧生成速度，不含 ASR/LLM/TTS/WebRTC 等链路开销。"待补充"表示该条目尚未在当前实验中采集到对应数据。

LiteAvatar / A10：用户提供 2026-06-16 16:18 OpenAvatarChat 运行日志 + nvidia-smi 输出。#openavatarchat-a10-log-2026-06-16
LAM / A10：用户提供 2026-06-16 16:27 OpenAvatarChat LAM 推理日志 + nvidia-smi 输出。#openavatarchat-lam-a10-log-2026-06-16
FlashHead Lite：数字人工程解读（二）：CyberVerse 实验记录——FlashHead Lite + wav2vec2 的端到端耗时拆解中的 Python Avatar 生成日志。#cyberverse-flashhead-experiment
FlashHead Pro / A10：用户提供 2026-06-16 17:35 CyberVerse FlashHead Pro 推理日志 + nvidia-smi 输出（A10, 512×512）。#cyberverse-flashhead-pro-a10-log-2026-06-16
LiveAct：数字人工程解读（一）：CyberVerse，把论文拼成一个能对话的实时数字人第六章硬件 benchmark 表。#cyberverse-source-read

OpenAvatarChat LiteAvatar A10 运行日志与 nvidia-smi 输出（2026-06-16 16:18）。用户提供原始数据。
OpenAvatarChat LAM A10 推理日志与 nvidia-smi 输出（2026-06-16 16:27）。用户提供原始数据。
CyberVerse 本地实验日志（2026-06-12）：SoulX-FlashHead-1_3B Lite + wav2vec2-base-960h Avatar 生成耗时。见数字人工程解读（二）。
CyberVerse FlashHead 1.3B Pro A10 推理日志与 nvidia-smi 输出（2026-06-16 17:35）。用户提供原始数据，512×512 分辨率。
CyberVerse 源码解读（2026-06-05）：README 硬件 benchmark 表。见数字人工程解读（一）。