Argos Translate 是一个开源的离线翻译库,支持多种语言之间的翻译,提供 Python 库、命令行和 GUI 应用三种使用方式。
LibreTranslate是一个免费的开源机器翻译API,支持自托管和离线使用,无需依赖商业翻译服务。
EditAnything是一个图像编辑和生成工具,支持多种智能技术,用户可以轻松编辑图像内容,进行创意融合和高质量角色编辑。
ShortGPT 是一个实验性的 AI 框架,用于自动化 YouTube 短视频和 TikTok 频道内容创作,旨在简化视频生成和配音流程。
ChatGPT-Telegram-Bot是一个基于Telegram的AI聊天机器人,支持个性化身份切换、实时响应和生成图像,提供流畅的用户体验。
VALL-E-X是微软VALL-E X零-shot文本转语音模型的开源实现,支持多语言语音合成和声音克隆,方便用户进行研究和应用。
MomoTranslator是一个基于OpenCV的漫画翻译辅助软件,具有查找画格、识别文字和支持Google、ChatGPT翻译等功能,适合漫画汉化者使用。
AudioSep是一个用于开放领域声音分离的基础模型,支持自然语言查询,能够实现音频事件分离、乐器分离和语音增强等功能。
Fooocus 是一款基于 Gradio 的离线图像生成软件,旨在简化用户生成图像的过程,只需关注提示和图像本身,适合快速生成需求。
该仓库提供anime角色图片的预处理工具,包括背景去除、人物裁剪、图片放大修复及PIXIV图片下载,便于生成适合训练的数据集。


