FireRedTTS是一个开源的文本转语音系统,利用大型语言模型技术,旨在提供高质量的语音合成服务。
Python
765
67
Mozilla Public License 2.0
2个月前
FireRedASR是一个开源工业级语音识别模型,支持普通话、方言和英语,具有优秀的歌词识别能力,已在公共普通话 ASR 基准上达到最新的性能水平。
Python
1,272
94
Apache License 2.0
2个月前
DeepEraser是一个文本擦除工具,利用深度迭代上下文挖掘技术,支持图像中文本的智能去除。
Python
43
7
MIT License
2个月前
Chipper是一个为开发者提供AI接口的工具,支持RAG管道、文档拆分和查询工作流,增强生成AI模型的信息检索能力。
Python
467
43
MIT License
2个月前
Vimo是一款革命性的桌面应用程序,利用先进的AI技术让用户与视频进行智能对话,能够处理任意长度的视频内容并准确回答问题。
Python
1,032
149
Other
2个月前
DiffSplat是一个生成框架,可以从文本提示和单视图图像中合成3D高斯点,速度为1~2秒,适用于图像扩散模型的重用。
Python
396
25
MIT License
2个月前
maestro 是一款用于加速多模态模型微调的工具,简化配置、数据加载和训练流程,支持常用视觉语言模型如Florence-2、PaliGemma 2和Qwen2.5-VL。
Python
2,630
217
Apache License 2.0
2个月前
VisoMaster是一个功能强大的视频换脸和编辑软件,利用AI技术轻松实现自然的效果,适合日常用户和专业人士。
Python
1,175
187
GNU General Public License v3.0
2个月前
Kiln是一个用于微调LLM模型、生成合成数据及数据集协作的工具,旨在加速AI原型开发。
Python
4,067
292
Other
2个月前
此仓库提供针对大语言模型的微调和强化学习工具,支持多种模型以提高训练速度和降低内存使用,适合初学者使用。
Python
44,590
3,608
Apache License 2.0
2个月前

trang chủ - Wiki
Copyright © 2011-2025 iteam. Current version is 2.147.0. UTC+08:00, 2025-10-28 05:54
浙ICP备14020137号-1 $bản đồ khách truy cập$