EditAnything是一个图像编辑和生成工具,支持多种智能技术,用户可以轻松编辑图像内容,进行创意融合和高质量角色编辑。
ShortGPT 是一个实验性的 AI 框架,用于自动化 YouTube 短视频和 TikTok 频道内容创作,旨在简化视频生成和配音流程。
ChatGPT-Telegram-Bot是一个基于Telegram的AI聊天机器人,支持个性化身份切换、实时响应和生成图像,提供流畅的用户体验。
VALL-E-X是微软VALL-E X零-shot文本转语音模型的开源实现,支持多语言语音合成和声音克隆,方便用户进行研究和应用。
MomoTranslator是一个基于OpenCV的漫画翻译辅助软件,具有查找画格、识别文字和支持Google、ChatGPT翻译等功能,适合漫画汉化者使用。
AudioSep是一个用于开放领域声音分离的基础模型,支持自然语言查询,能够实现音频事件分离、乐器分离和语音增强等功能。
Fooocus 是一款基于 Gradio 的离线图像生成软件,旨在简化用户生成图像的过程,只需关注提示和图像本身,适合快速生成需求。
该仓库提供anime角色图片的预处理工具,包括背景去除、人物裁剪、图片放大修复及PIXIV图片下载,便于生成适合训练的数据集。
LightGlue是一个轻量级的特征匹配工具,利用深度神经网络快速匹配图像对中的局部特征,具有高准确率和快速推理能力。
vid2vid是一个基于Pytorch的视频翻译实现,能够将语义标签图转化为高分辨率照片级真实感视频,支持多种输入形式,例如边缘图和姿态图。