Bark-Voice-Cloning是一个语音克隆工具,支持中文和英文音频的转换,用户可通过简单的界面实现音频合成与克隆。
Jupyter Notebook
2,947
420
MIT License
7个月前
llama2-webui是一个基于gradio的网页用户界面,允许用户在本地GPU或CPU上运行各种Llama 2模型,适用于生成代理和应用。
Jupyter Notebook
1,957
206
MIT License
7个月前
MobileSAM是一个轻量级的图像分割项目,旨在让手机应用程序和其他设备更快地实现图像分割功能。
Jupyter Notebook
5,342
544
Apache License 2.0
7个月前
该仓库提供高质量的零-shot图像分割模型HQ-SAM,旨在提升SAM的性能,支持视频分割等应用。
Jupyter Notebook
4,045
248
Apache License 2.0
7个月前
这个仓库提供开源的强大图像识别模型,主要用于高精度图像标记和分类,支持多种常见和开放类别的识别。
Jupyter Notebook
3,389
310
Apache License 2.0
7个月前
OpenGPT是一个框架,用于创建基于指令的医学数据集,并训练会话领域专家的大型语言模型(LLMs)。
Jupyter Notebook
360
44
Apache License 2.0
7个月前
LAVIS是一个集成语言与视觉智能的库,支持多种模态的整合,适用于图像、视频、音频等任务。
Jupyter Notebook
10,853
1,060
BSD 3-Clause "New" or "Revised" License
7个月前
LangChain是一个构建基于大型语言模型(LLM)的应用程序的框架,旨在简化AI应用的开发和集成。
Jupyter Notebook
114,109
18,705
MIT License
7个月前
Inpaint-Anything是一个强大的图像处理工具,支持在图片、视频和3D场景中智能去除或替换对象,满足用户的多样化图像编辑需求。
Jupyter Notebook
7,368
632
Apache License 2.0
7个月前
Bark是一个开源的文本到音频生成模型,能生成真实感强的多语言语音及其他音频,包括音乐和背景噪音,适用于研究和商业用途。
Jupyter Notebook
38,409
4,601
MIT License
7个月前
Grounded-Segment-Anything仓库结合了Grounding DINO和Segment Anything,旨在自动检测、分割和生成任何对象,提供强大的图像处理能力。
Jupyter Notebook
16,820
1,529
Apache License 2.0
7个月前
Segment Anything 是一个用于图像和视频分割的基础模型,提供代码、训练模型下载链接及示例,便于用户快速上手。
Jupyter Notebook
51,622
6,057
Apache License 2.0
7个月前
该仓库实现了“按顺序着装:用于姿态转移、虚拟试穿和服装编辑的人物图像生成”的研究,主要用于虚拟试穿和服装修改的研究和实践。
Jupyter Notebook
551
131
Other
8个月前
PIDM是一个通过去噪扩散模型进行人像合成的项目,提供了基于Google Colab的演示,便于用户生成高质量的人像图像。
Jupyter Notebook
496
60
MIT License
8个月前
该仓库提供CVPR 2021论文《运动表示用于关节动画》的源代码,旨在实现基于驱动视频的动画生成。
Jupyter Notebook
1,266
355
Other
8个月前

Home - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.1. UTC+08:00, 2026-04-11 01:42
浙ICP备14020137号-1 $Map of visitor$