TangoFlux是一个快速且忠实的文本转语音生成工具,利用流匹配技术实现高质量音频生成。
雅鸭IELTSDuck是一款专为雅思作文设计的智能助手,提供评分、反馈和自动生成作文等功能,旨在提升用户的写作能力。
MobileAgent是一个强大的GUI代理工具,提供多模态跨平台GUI感知和操作功能,适用于多种应用场景。
Sweep是一个为JetBrains开发的AI编程助手,旨在提升编程效率和代码质量。
该仓库展示了多种增强检索生成(RAG)系统的先进技术,旨在提升系统的准确性和上下文丰富性。
GenAI_Agents仓库提供多种生成式AI代理技术的教程和实现,涵盖从基础到高级的开发,全方位指导构建智能互动AI系统。
Ollama-OCR是一个强大的光学字符识别工具,利用先进的视觉语言模型从图像和PDF中提取文本,支持多种输出格式与批量处理。
JoyCaption是一个开源免费的图像描述视觉语言模型,旨在为社区提供训练扩散模型的工具,支持多种图像风格和内容。
该仓库提供使用Gemini API的示例和指南,包含快速入门和实用案例,帮助用户高效学习和实践。
E2M是一个Python库,将多种文件格式(如doc, pdf, ppt等)转换为Markdown,便于数据处理和利用。
此仓库提供了构建检索增强生成(RAG)应用的全面指南,包含从基础到高级实现的Jupyter Notebook,帮助用户快速上手和定制RAG聊天机器人。
该仓库提供基于检索增强生成(RAG)技术的对话系统实例,专注于葡萄酒分类及餐食搭配,包含多种RAG实现方式。
FastHTML是一个新一代网页框架,旨在快速构建高效、可扩展的网页应用,使用简单的Python代码实现复杂功能。
EfficientSAM是一个高效的图像和视频分割基础模型,利用掩膜图像预训练,实现快速和精准的分割任务。
该仓库提供中文AI写作工具,支持生成诗词和对联,适用于训练和微调相关模型。


