类库 - công cụ trực tuyến

FireRedTeam/FireRedTTS

FireRedTTS是一个开源的文本转语音系统，利用大型语言模型技术，旨在提供高质量的语音合成服务。

Python

765

67

Mozilla Public License 2.0

2个月前

FireRedTeam/FireRedASR

FireRedASR是一个开源工业级语音识别模型，支持普通话、方言和英语，具有优秀的歌词识别能力，已在公共普通话 ASR 基准上达到最新的性能水平。

Python

1,272

94

Apache License 2.0

2个月前

fh2019ustc/DeepEraser

DeepEraser是一个文本擦除工具，利用深度迭代上下文挖掘技术，支持图像中文本的智能去除。

Python

43

7

MIT License

2个月前

TilmanGriesel/chipper

Chipper是一个为开发者提供AI接口的工具，支持RAG管道、文档拆分和查询工作流，增强生成AI模型的信息检索能力。

Python

467

43

MIT License

2个月前

HKUDS/Vimo

Vimo是一款革命性的桌面应用程序，利用先进的AI技术让用户与视频进行智能对话，能够处理任意长度的视频内容并准确回答问题。

Python

1,032

149

Other

2个月前

chenguolin/DiffSplat

DiffSplat是一个生成框架，可以从文本提示和单视图图像中合成3D高斯点，速度为1~2秒，适用于图像扩散模型的重用。

Python

396

25

MIT License

2个月前

roboflow/maestro

maestro 是一款用于加速多模态模型微调的工具，简化配置、数据加载和训练流程，支持常用视觉语言模型如Florence-2、PaliGemma 2和Qwen2.5-VL。

Python

2,630

217

Apache License 2.0

2个月前

visomaster/VisoMaster

VisoMaster是一个功能强大的视频换脸和编辑软件，利用AI技术轻松实现自然的效果，适合日常用户和专业人士。

Python

1,175

187

GNU General Public License v3.0

2个月前

Kiln-AI/Kiln

Kiln是一个用于微调LLM模型、生成合成数据及数据集协作的工具，旨在加速AI原型开发。

Python

4,067

292

Other

2个月前

unslothai/unsloth

此仓库提供针对大语言模型的微调和强化学习工具，支持多种模型以提高训练速度和降低内存使用，适合初学者使用。

Python

44,590

3,608

Apache License 2.0

2个月前

类库

文库