Fooocus 是一款基于 Gradio 的离线图像生成软件,旨在简化用户生成图像的过程,只需关注提示和图像本身,适合快速生成需求。
该仓库提供anime角色图片的预处理工具,包括背景去除、人物裁剪、图片放大修复及PIXIV图片下载,便于生成适合训练的数据集。
LightGlue是一个轻量级的特征匹配工具,利用深度神经网络快速匹配图像对中的局部特征,具有高准确率和快速推理能力。
vid2vid是一个基于Pytorch的视频翻译实现,能够将语义标签图转化为高分辨率照片级真实感视频,支持多种输入形式,例如边缘图和姿态图。
XHS-Downloader是一个小红书链接提取与作品采集工具,支持提取账号作品、下载无水印文件及采集作品信息。
SMPLer-X是一个用于人类姿态和形状估计的框架,基于最新的深度学习技术,旨在提高估计精度和表现力。
vits_chinese是基于BERT和VITS的最佳实践文本转语音(TTS)项目,具有自然语音特性,支持ONNX流输出,适合TTS算法学习。
Audio Slicer 是一个简单的图形界面应用程序,能够通过静音检测切割音频文件,方便用户处理音频素材。
RAD-NeRF是一个实时神经辐射合成工具,通过音频空间分解生成动态人像,基于PyTorch实现,适合实时应用与研究。
sd-webui-fastblend 是一个无模型算法,旨在使视频平滑流畅,可去除视频中的闪烁或通过关键帧渲染流畅视频。