SegDrawer是一个基于Web的静态掩膜绘制工具,支持语义分割和视频分割,使用交互式的Segment Anything Model 2(SAM2)。
AutoGPT是一个强大的平台,允许用户创建、部署和管理持续的AI智能体,自动化复杂工作流程。
该仓库为stable-diffusion-webui的扩展,旨在限制提示词的影响范围,支持多种版本的Stable Diffusion,优化图像生成过程。
Voice Changer是一个实时语音变换软件,利用AI技术支持多平台音频转换,适合需要实时声音处理的用户。
VideoCrafter是一个开源视频生成和编辑工具,支持文本转视频和图像转视频功能,旨在创造高质量的视频内容。
ItChat是一个方便的微信个人号接口,用户可以用Python轻松创建微信机器人,处理信息交互,提升社交效率。
DiffusionDB是首个大规模文本生成图像数据集,包含1400万张由真实用户用Stable Diffusion生成的图像,为研究生成模型与提示之间的关系提供了丰富的数据支持。
text2vec是一个文本向量化工具,可将文本转化为向量矩阵,支持多种文本表征和相似度计算模型,如Word2Vec和BERT,便于进行文本语义匹配。
document.ai 是一个基于向量数据库和GPT3.5构建的本地知识库方案,旨在优化问答查询,提升信息检索的准确性和实用性。
SadTalker 是一个用于生成基于音频驱动的单图像实时3D动画的工具,能够让静态人脸进行自然口语动画。