ADK Image Agent与GPT-Image-1结合,提供图像生成、编辑和处理工具,适用于用户通过文本描述创建和修改图像。

ClearerVoice-Studio是一个开源的AI语音处理工具包,支持语音增强、分离和目标说话人提取等功能,提供预训练模型和相关脚本。
Facecastify是一个基于AI的面部表情生成工具,支持上传角色图片生成多种表情,适用于Glowfic画廊管理。
SeedVR是一个视频恢复工具,基于扩散变换器技术,旨在提升视频质量,适用于多种应用场景,特别是计算机视觉领域。
SynthID Text 提供了一种文本水印生成与检测的参考实现,主要用于研究目的,帮助用户在生成模型中应用水印技术。
AppEvalPilot是一个先进的自动评估框架,旨在高效评估桌面、移动和基于Web的软件应用,支持全自动化流程,省时省力,适合开发者和QA团队使用。

Audiblez是一个将电子书转化为有声书的工具,支持多种语言的高质量语音合成,适用于各类平台。
ChatGPT on WeChat是一个智能聊天机器人,支持多种平台接入,可处理多模态消息,集成多种大模型,适用于智能客服和企业应用。
SpatialGen是一个用于生成3D室内场景的工具,基于语义布局和多视角、多模态扩散模型,支持图像和文本输入。

Step-Audio 2是一个面向工业级音频理解和语音对话的端到端多模态大型语言模型,旨在提升音频处理能力。