HiDream-E1是一个基于HiDream-I1的图像编辑模型,支持动态分辨率,旨在提升图像质量和编辑准确性。
Python
764
55
MIT License
5天前
VARGPT-v1.1是一个改进的视觉自回归大统一模型,结合迭代指令调优和强化学习,旨在提升模型的性能与应用效果。
Python
262
15
Apache License 2.0
1周前
OneFileLLM是一个命令行工具,可将多种数据源(如GitHub、网页、PDF等)聚合成结构化XML文件,便于大语言模型的使用。
Python
1,651
152
MIT License
5天前
Pusa是一个视频扩散模型,支持细粒度的时间控制,适用于生成高质量的视频内容。
Python
594
44
Apache License 2.0
4天前
ScholarCopilot是一个智能学术写作助手,通过AI文本补全和引用建议提升研究写作效率,帮助用户保持高水平的学术标准。
Python
227
23
MIT License
1周前
Pipecat是一个开源Python框架,用于构建实时语音和多模态对话代理,支持音频、视频和AI服务的无缝协作。
Python
7,702
1,196
BSD 2-Clause "Simplified" License
4天前
PDM是一个现代的Python包和依赖管理工具,支持最新的PEP标准,旨在提供简便实用的包管理体验。
Python
8,454
449
MIT License
4天前
Spark-TTS是一个高效的基于LLM的文本到语音模型的推理代码,使用PyTorch实现,旨在提供流畅的语音合成。
Python
10,395
1,107
Apache License 2.0
4天前
OmniSVG是首个端到端的多模态SVG生成器,利用预训练的视觉-语言模型,能够生成从简单图标到复杂动漫角色的详细SVG图形。
Python
2,099
64
Apache License 2.0
4天前
adk-python是一个开源的Python工具包,用于灵活地构建、评估和部署复杂的AI代理,旨在简化代理开发流程。
Python
12,329
1,733
Apache License 2.0
4天前

首页 - Wiki
Copyright © 2011-2025 iteam. Current version is 2.146.0. UTC+08:00, 2025-08-28 20:58
浙ICP备14020137号-1 $访客地图$