此仓库提供了构建检索增强生成(RAG)应用的全面指南,包含从基础到高级实现的Jupyter Notebook,帮助用户快速上手和定制RAG聊天机器人。
该仓库提供基于检索增强生成(RAG)技术的对话系统实例,专注于葡萄酒分类及餐食搭配,包含多种RAG实现方式。
FastHTML是一个新一代网页框架,旨在快速构建高效、可扩展的网页应用,使用简单的Python代码实现复杂功能。
EfficientSAM是一个高效的图像和视频分割基础模型,利用掩膜图像预训练,实现快速和精准的分割任务。
该仓库提供中文AI写作工具,支持生成诗词和对联,适用于训练和微调相关模型。
该仓库用于将文本转化为知识图谱,可用于增强生成或基于知识图谱的问答系统。
Seamless是一个AI模型系列,提供多语言的自然和真实交流,支持语音与文本翻译,涵盖约100种语言。
Emotional VITS是一个无需情感标注的情感可控语音合成模型,基于VITS实现,通过提取语句情感embedding输入网络,支持情感控制合成。
Realfill是一个用于个性化文本转图像填补模型(如stable diffusion inpainting)的方法,只需提供少量场景图像即可进行训练。
Watermark-Removal-Pytorch是基于深度图像先验技术的水印去除工具,使用CNN模型有效去除图像中的水印,支持简单调用API.
该仓库使用Tensorflow对象检测API将手语翻译为英语词汇,支持实时识别美式手语,如'你好'、'我爱你'等。它为用户提供了图像采集和标注的工具,方便快速训练模型。
该仓库提供了一种零-shot文本引导的视频到视频转换框架,旨在解决视频帧之间的时间一致性问题。
Jsonformer是一种高效生成结构化JSON的工具,利用语言模型生成内容令牌,并填充固定令牌,确保生成的JSON符合语法和结构。
IP-Adapter是一个轻量级的适配器,旨在为预训练的文本到图像扩散模型提供图像提示功能,实现多模态图像生成。
FaceChain是一个深度学习工具链,用于生成保留身份的人像,支持多种风格,一张照片即可在10秒内生成个性化肖像。


