VITS是一个实现日本语、汉语、韩语、梵语和泰语的语音合成模型,提供了数据集创建、训练和推理的功能。
该仓库是Stable Diffusion WebUI的扩展,提供高分辨率深度图生成,支持3D图像对、法线图及3D网格创建,适合3D引擎使用。
这是一个为Starlette和FastAPI设计的流量限制库,帮助开发者控制API请求速率,适用于高并发环境。
Textstat是一个Python库,用于计算文本的可读性统计数据,包括段落、句子和文章的复杂性和年级水平。
LaWGPT是一个基于中文法律知识的大语言模型,旨在提升法律领域的语义理解和问答能力,支持法律问题的对话和相关数据集的构建。
Quivr是一个利用生成式AI构建个人助手的工具,支持多种文件格式和LLM,并可自定义快速集成到现有产品中。
sd-webui-supermerger是一个用于稳定扩散Web界面的模型合并扩展,可以无须保存就直接加载合并模型进行图像生成,极大提高了效率。
DragGAN是一个用于生成图像的交互式点基操控工具,支持用户对生成图像进行高效编辑和修改。
MOSS是复旦大学开发的开源对话语言模型工具,支持多轮对话及插件功能,适用于多种用途,如智能助手与交互式应用。
该仓库实现了Natural Speech 2,是一个基于Pytorch的零-shot语音与歌唱合成系统,使用神经音频编码和扩散模型生成自然语音。