该仓库实现了Natural Speech 2,是一个基于Pytorch的零-shot语音与歌唱合成系统,使用神经音频编码和扩散模型生成自然语音。
这是一个基于sd-webui的扩展,旨在提升提示词输入框的使用体验,提供自动翻译、历史记录和收藏等功能。
这是一个用于像素化图像的官方实现,支持根据用户输入生成精细的像素艺术,适用于图像处理和游戏开发等领域。
这个仓库是一个用于将图片像素化的Web界面扩展,用户可以通过扩展中的额外功能进行图片处理。
pytoshop是一个基于Python的库,用于读取和写入Photoshop PSD和PSB文件,支持解析重要标签和复杂的嵌套图层结构。
Layer-Divider是一个用于stable-diffusion-webui的扩展,利用Segment-Anything模型将图层划分并保存为PSD文件。
这是一个用于生成和放大大图像的扩展,支持多种采样技术,适用于VRAM有限的环境,致力于提升图像质量。
川虎Chat为ChatGPT等多种语言模型提供友好的Web图形界面,支持文件问答、在线搜索和模型微调等功能。
GLM-130B是一个开放的双语预训练模型,支持中英文,具有1300亿参数,适用于推理任务,性能超越多种大型模型。
Ultimate Vocal Remover GUI是一个基于深度神经网络的语音去除应用,允许用户从音频文件中分离人声。


