StyleTalk是一个生成可控说话风格的实时头部视频的工具,支持用户通过指定样式视频来生成相应的虚拟人说话视频。
Python
518
51
MIT License
1个月前
GeneFace是一个高保真3D人脸合成工具,通过音频生成逼真、同步的说话人脸,广泛应用于动画和虚拟角色展示。
Python
2,625
299
MIT License
2周前
DiffSinger是一个基于浅层扩散机制的歌声合成工具,支持音频生成和文本转语音功能,适用于研究和应用开发。
Python
4,590
766
MIT License
2周前
LiveSpeechPortraits 是一个实时生成个性化逼真说话头像动画的系统,仅通过音频信号驱动,具备高效的表现能力。
Python
1,275
218
MIT License
3周前
该仓库提供了一个可控姿态的语音驱动人脸生成系统,允许用户通过音频控制人脸的头部姿势,旨在实现自然的视频合成效果。
Python
950
173
Creative Commons Attribution 4.0 International
3周前
FACIAL是一个基于PyTorch的项目,通过隐式属性学习合成动态对话人脸,适用于动态视频合成和计算机视觉研究。
Python
382
83
GNU Affero General Public License v3.0
2个月前
VideoReTalking是一个基于音频的 lip 同步工具,旨在帮助用户高效地进行说话人的视频编辑,适用于真实场景下的应用。
Python
7,120
1,052
Apache License 2.0
2周前
DINet 是一个用于高分辨率视频中现实人脸视觉配音的变形修复网络,提供推理和训练代码,适合自定义视频处理。
Python
1,086
190
3周前
FACEGOOD-Audio2Face项目将音频转换为表情权重,驱动数字人类模型xiao mei,适用于动画制作与人工智能应用。
Python
1,887
366
MIT License
2周前
VITS-fast-fine-tuning仓库提供快速说话人适应的文本转语音(TTS)和多对多声音转换的流程,用户可以根据已有角色或自己的声音进行音频合成和转换。
Python
4,969
737
Apache License 2.0
2周前

Accueil - Wiki
Copyright © 2011-2025 iteam. Current version is 2.146.0. UTC+08:00, 2025-09-10 04:24
浙ICP备14020137号-1 $Carte des visiteurs$