类库 - 온라인도구

yerfor/GeneFace

GeneFace是一个高保真3D人脸合成工具，通过音频生成逼真、同步的说话人脸，广泛应用于动画和虚拟角色展示。

Python

2,625

299

MIT License

2个月前

MoonInTheRiver/DiffSinger

DiffSinger是一个基于浅层扩散机制的歌声合成工具，支持音频生成和文本转语音功能，适用于研究和应用开发。

Python

4,590

766

MIT License

2个月前

YuanxunLu/LiveSpeechPortraits

LiveSpeechPortraits 是一个实时生成个性化逼真说话头像动画的系统，仅通过音频信号驱动，具备高效的表现能力。

Python

1,275

218

MIT License

2个月前

Hangz-nju-cuhk/Talking-Face_PC-AVS

该仓库提供了一个可控姿态的语音驱动人脸生成系统，允许用户通过音频控制人脸的头部姿势，旨在实现自然的视频合成效果。

Python

950

173

Creative Commons Attribution 4.0 International

2个月前

zhangchenxu528/FACIAL

FACIAL是一个基于PyTorch的项目，通过隐式属性学习合成动态对话人脸，适用于动态视频合成和计算机视觉研究。

Python

382

83

GNU Affero General Public License v3.0

3个月前

OpenTalker/video-retalking

VideoReTalking是一个基于音频的 lip 同步工具，旨在帮助用户高效地进行说话人的视频编辑，适用于真实场景下的应用。

Python

7,120

1,052

Apache License 2.0

2个月前

MRzzm/DINet

DINet 是一个用于高分辨率视频中现实人脸视觉配音的变形修复网络，提供推理和训练代码，适合自定义视频处理。

Python

1,086

190

2个月前

FACEGOOD/FACEGOOD-Audio2Face

FACEGOOD-Audio2Face项目将音频转换为表情权重，驱动数字人类模型xiao mei，适用于动画制作与人工智能应用。

Python

1,887

366

MIT License

2个月前

Plachtaa/VITS-fast-fine-tuning

VITS-fast-fine-tuning仓库提供快速说话人适应的文本转语音（TTS）和多对多声音转换的流程，用户可以根据已有角色或自己的声音进行音频合成和转换。

Python

4,969

737

Apache License 2.0

2个月前

CjangCjengh/vits

VITS是一个实现日本语、汉语、韩语、梵语和泰语的语音合成模型，提供了数据集创建、训练和推理的功能。

Python

931

196

MIT License

2个月前

类库

文库