类库 - 온라인도구

RVC-Project/Retrieval-based-Voice-Conversion-WebUI

Retrieval-based-Voice-Conversion-WebUI是一个基于VITS的变声框架，用户可以轻松训练适用于10分钟以内语音数据的变声模型。

Python

31,640

4,423

MIT License

2个月前

huggingface/diffusers

diffusers是一个用于生成图像、音频和三维分子结构的预训练扩散模型库，支持简单推理和自定义模型训练，专注于用户体验。

Python

30,453

6,247

Apache License 2.0

2个月前

nateraw/stable-diffusion-videos

这个仓库用于利用Stable Diffusion生成视频，通过在文本提示间进行变换和插值来创建炫酷的视频效果。

Python

4,620

445

Apache License 2.0

2个月前

qianqianwang68/omnimotion

OmniMotion是一个基于PyTorch的实现，用于跟踪多个物体，并适用于ICC 2023论文研究，提供训练和数据处理功能。

Python

2,235

126

Apache License 2.0

2个月前

ashawkey/stable-dreamfusion

Stable-Dreamfusion 是一个基于 PyTorch 的文本到 3D 模型实现，结合了 Stable Diffusion，用于生成 3D 内容和导出网格。

Python

8,706

763

Apache License 2.0

2个月前

IceClear/StableSR

StableSR是一个基于扩散先验的图像超分辨率项目，旨在提高真实世界图像的清晰度和细节，还原高质量图像。

Python

2,522

159

Other

2个月前

pkuliyi2015/sd-webui-stablesr

sd-webui-stablesr 是一个用于Stable Diffusion WebUI的超高质量图像放大工具，采用竞争性超分辨率算法，提升图像细节和质量。

Python

1,096

58

Other

2个月前

OpenGVLab/DragGAN

DragGAN是一个开源项目，用于实现基于交互点的生成图像操作，支持用户通过简单拖拽来修改图片，适用于各种类型的操作与演示。

Python

4,982

490

2个月前

OpenGVLab/InternGPT

InternGPT是一个开源演示平台，支持DragGAN、ChatGPT等多种AI模型，使用户能以拖拽和绘图方式与AI互动，提升交流效率与准确性。

Python

3,216

231

Apache License 2.0

2个月前

FuxiVirtualHuman/styletalk

StyleTalk是一个生成可控说话风格的实时头部视频的工具，支持用户通过指定样式视频来生成相应的虚拟人说话视频。

Python

518

51

MIT License

2个月前

类库

文库