HiDream-E1是一个基于HiDream-I1的图像编辑模型,支持动态分辨率,旨在提升图像质量和编辑准确性。
VARGPT-v1.1是一个改进的视觉自回归大统一模型,结合迭代指令调优和强化学习,旨在提升模型的性能与应用效果。
OneFileLLM是一个命令行工具,可将多种数据源(如GitHub、网页、PDF等)聚合成结构化XML文件,便于大语言模型的使用。
Pusa是一个视频扩散模型,支持细粒度的时间控制,适用于生成高质量的视频内容。
ScholarCopilot是一个智能学术写作助手,通过AI文本补全和引用建议提升研究写作效率,帮助用户保持高水平的学术标准。
Pipecat是一个开源Python框架,用于构建实时语音和多模态对话代理,支持音频、视频和AI服务的无缝协作。
PDM是一个现代的Python包和依赖管理工具,支持最新的PEP标准,旨在提供简便实用的包管理体验。
Spark-TTS是一个高效的基于LLM的文本到语音模型的推理代码,使用PyTorch实现,旨在提供流畅的语音合成。
OmniSVG是首个端到端的多模态SVG生成器,利用预训练的视觉-语言模型,能够生成从简单图标到复杂动漫角色的详细SVG图形。
adk-python是一个开源的Python工具包,用于灵活地构建、评估和部署复杂的AI代理,旨在简化代理开发流程。