AITuber Server是一个基于WebSocket的服务器,支持与Open Interpreter进行交互,能够接收消息和文件,并进行相应处理。
Text2Human是一个基于PyTorch的人类图像生成工具,支持通过文本描述生成可控的人物图像,适用于研究与应用。
Argos Translate 是一个开源的离线翻译库,支持多种语言之间的翻译,提供 Python 库、命令行和 GUI 应用三种使用方式。
LibreTranslate是一个免费的开源机器翻译API,支持自托管和离线使用,无需依赖商业翻译服务。
EditAnything是一个图像编辑和生成工具,支持多种智能技术,用户可以轻松编辑图像内容,进行创意融合和高质量角色编辑。
ShortGPT 是一个实验性的 AI 框架,用于自动化 YouTube 短视频和 TikTok 频道内容创作,旨在简化视频生成和配音流程。
ChatGPT-Telegram-Bot是一个基于Telegram的AI聊天机器人,支持个性化身份切换、实时响应和生成图像,提供流畅的用户体验。
VALL-E-X是微软VALL-E X零-shot文本转语音模型的开源实现,支持多语言语音合成和声音克隆,方便用户进行研究和应用。
MomoTranslator是一个基于OpenCV的漫画翻译辅助软件,具有查找画格、识别文字和支持Google、ChatGPT翻译等功能,适合漫画汉化者使用。
AudioSep是一个用于开放领域声音分离的基础模型,支持自然语言查询,能够实现音频事件分离、乐器分离和语音增强等功能。