Spark-TTS是一个高效的基于LLM的文本到语音模型的推理代码,使用PyTorch实现,旨在提供流畅的语音合成。
Python
10,395
1,107
Apache License 2.0
2个月前
OmniSVG是首个端到端的多模态SVG生成器,利用预训练的视觉-语言模型,能够生成从简单图标到复杂动漫角色的详细SVG图形。
Python
2,099
64
Apache License 2.0
2个月前
adk-python是一个开源的Python工具包,用于灵活地构建、评估和部署复杂的AI代理,旨在简化代理开发流程。
Python
12,329
1,733
Apache License 2.0
2个月前
KTransformers是一个灵活的Python框架,旨在通过先进的内核优化和并行策略提升Transformers体验,支持各类LLM推理优化。
Python
14,902
1,066
Apache License 2.0
2个月前
LightRAG是一个简单快速的检索增强生成模型,旨在提升自然语言处理任务的效率与效果。
Python
19,871
2,848
MIT License
2个月前
AutoAgent是一个完全自动化且零代码的LLMz框架,旨在简化大语言模型的使用。
Python
5,795
794
MIT License
2个月前
TTT-Video是一个基于PyTorch的库,用于生成一分钟视频,利用测试时训练方法进行样式转换和上下文扩展。
Python
2,061
171
MIT License
2个月前
UI-R1是一个基于强化学习的框架,旨在提升多模态大语言模型在图形用户界面动作预测任务中的推理能力,显著提高预测准确率。
Python
125
8
Apache License 2.0
2个月前
FlashRAG是一个Python工具包,专注于高效的检索增强生成(RAG)研究,提供多个基准数据集和先进算法,便于用户快速复现研究成果。
Python
2,637
228
MIT License
2个月前
HiDream-I1是一个开源的图像生成模型,具有170亿参数,能够在数秒内生成高质量图像,适用于各种图像处理场景。
Python
2,398
229
MIT License
2个月前

首页 - Wiki
Copyright © 2011-2025 iteam. Current version is 2.147.1. UTC+08:00, 2025-11-04 09:26
浙ICP备14020137号-1 $访客地图$