ADK Image Agent与GPT-Image-1结合,提供图像生成、编辑和处理工具,适用于用户通过文本描述创建和修改图像。
Python
5
0
MIT License
1个月前
LiquidError/adk-image-agent-with-gpt-image-1 cover
ClearerVoice-Studio是一个开源的AI语音处理工具包,支持语音增强、分离和目标说话人提取等功能,提供预训练模型和相关脚本。
Python
3,351
273
Apache License 2.0
1个月前
Facecastify是一个基于AI的面部表情生成工具,支持上传角色图片生成多种表情,适用于Glowfic画廊管理。
Python
1
0
1个月前
SeedVR是一个视频恢复工具,基于扩散变换器技术,旨在提升视频质量,适用于多种应用场景,特别是计算机视觉领域。
Python
556
33
Apache License 2.0
1个月前
SynthID Text 提供了一种文本水印生成与检测的参考实现,主要用于研究目的,帮助用户在生成模型中应用水印技术。
Python
571
59
Apache License 2.0
1个月前
AppEvalPilot是一个先进的自动评估框架,旨在高效评估桌面、移动和基于Web的软件应用,支持全自动化流程,省时省力,适合开发者和QA团队使用。
Python
68
6
MIT License
1个月前
tanghaom/AppEvalPilot cover
Audiblez是一个将电子书转化为有声书的工具,支持多种语言的高质量语音合成,适用于各类平台。
Python
5,491
357
MIT License
1个月前
ChatGPT on WeChat是一个智能聊天机器人,支持多种平台接入,可处理多模态消息,集成多种大模型,适用于智能客服和企业应用。
Python
38,945
9,423
MIT License
1个月前
SpatialGen是一个用于生成3D室内场景的工具,基于语义布局和多视角、多模态扩散模型,支持图像和文本输入。
Python
177
9
MIT License
1个月前
manycore-research/SpatialGen cover
Step-Audio 2是一个面向工业级音频理解和语音对话的端到端多模态大型语言模型,旨在提升音频处理能力。
Python
994
56
Apache License 2.0
1个月前

Главная - Вики-сайт
Copyright © 2011-2025 iteam. Current version is 2.146.0. UTC+08:00, 2025-10-16 07:48
浙ICP备14020137号-1 $Гость$