类库 › daVinci-MagiHuman
GAIR-NLP

GAIR-NLP/daVinci-MagiHuman

daVinci-MagiHuman是一个用于生成音频-视频内容的单流Transformer基础模型。它能根据文本快速生成高质量、富有表现力的人像视频,包含同步的语音和动作,支持多种语言。特点包括推理速度快、生成质量高,并完全开源模型和代码。

1,585 134 1,585 24
在 GitHub 上查看
GAIR-NLP/daVinci-MagiHuman

技术栈

查看全部依赖 (31)

依赖

Pandas Pydantic accelerate av beautifulsoup4 boto3 debugpy depyf diffusers ffmpeg-python ftfy graphviz imageio loguru mosaicml_streaming numba packaging psycopg2-binary pydantic-settings redis redislite rich scipy sentencepiece setuptools soundfile timm torchao transformers unfoldNd versioningit

截图

cover
assets/architecture.png

评论

首页 - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.1. UTC+08:00, 2026-04-05 08:16
浙ICP备14020137号-1 $访客地图$