Audiblez是一个将电子书转化为有声书的工具,支持多种语言的高质量语音合成,适用于各类平台。
ChatGPT on WeChat是一个智能聊天机器人,支持多种平台接入,可处理多模态消息,集成多种大模型,适用于智能客服和企业应用。
SpatialGen是一个用于生成3D室内场景的工具,基于语义布局和多视角、多模态扩散模型,支持图像和文本输入。
Step-Audio 2是一个面向工业级音频理解和语音对话的端到端多模态大型语言模型,旨在提升音频处理能力。
GMTalker是一个智能数字人系统,集成语音识别、合成与3D渲染,支持科研、教育及虚拟人应用开发。
该仓库是一个代理服务器的统一 hosts 文件聚合器,整合多个来源的优质 hosts 文件,并提供可选扩展,帮助用户屏蔽广告及不良网站。
CityDreamer4D是一个无边界四维城市的组合生成模型,旨在生成城市结构和场景,用于城市规划和虚拟现实等应用。
WAT是一个强大的Python对象检查工具,帮助用户在运行时深入探索和调试不明对象,易于理解其结构和属性。
Cortex是一个个人训练MoE大模型的实践项目,涵盖从预训练到DPO的完整流程,提供模型的各阶段checkpoint下载。
Jina-Serve是一个框架,用于构建和部署多模态AI服务,支持gRPC、HTTP和WebSockets通信,方便从本地开发到生产环境的扩展。


