FACIAL是一个基于PyTorch的项目,通过隐式属性学习合成动态对话人脸,适用于动态视频合成和计算机视觉研究。
Python
382
83
GNU Affero General Public License v3.0
3个月前
VideoReTalking是一个基于音频的 lip 同步工具,旨在帮助用户高效地进行说话人的视频编辑,适用于真实场景下的应用。
Python
7,120
1,052
Apache License 2.0
2个月前
DINet 是一个用于高分辨率视频中现实人脸视觉配音的变形修复网络,提供推理和训练代码,适合自定义视频处理。
Python
1,086
190
2个月前
FACEGOOD-Audio2Face项目将音频转换为表情权重,驱动数字人类模型xiao mei,适用于动画制作与人工智能应用。
Python
1,887
366
MIT License
2个月前
VITS-fast-fine-tuning仓库提供快速说话人适应的文本转语音(TTS)和多对多声音转换的流程,用户可以根据已有角色或自己的声音进行音频合成和转换。
Python
4,969
737
Apache License 2.0
2个月前
VITS是一个实现日本语、汉语、韩语、梵语和泰语的语音合成模型,提供了数据集创建、训练和推理的功能。
Python
931
196
MIT License
3个月前
该仓库是Stable Diffusion WebUI的扩展,提供高分辨率深度图生成,支持3D图像对、法线图及3D网格创建,适合3D引擎使用。
Python
1,822
164
MIT License
2个月前
这是一个为Starlette和FastAPI设计的流量限制库,帮助开发者控制API请求速率,适用于高并发环境。
Python
1,578
96
MIT License
2个月前
Textstat是一个Python库,用于计算文本的可读性统计数据,包括段落、句子和文章的复杂性和年级水平。
Python
1,310
177
MIT License
2个月前
LaWGPT是一个基于中文法律知识的大语言模型,旨在提升法律领域的语义理解和问答能力,支持法律问题的对话和相关数据集的构建。
Python
6,000
551
GNU General Public License v3.0
2个月前

首页 - Wiki
Copyright © 2011-2025 iteam. Current version is 2.147.1. UTC+08:00, 2025-11-05 23:06
浙ICP备14020137号-1 $访客地图$