ChatGLM2-Voice-Cloning提供沉浸式对话体验,用户可以与任意角色实时对话,结合ChatGLM2、声音克隆与SadTalker技术。
pytextclassifier是一个开源的Python文本分类工具包,支持多种分类和聚类算法,适用于情感分析和文本风险分类等任务。
Text2Cinemagraph是一个基于文本描述生成动态影像的工具,支持将文本提示转化为艺术风格与自然风格对应的定格动画。
g2pM是一个基于新开放基准数据集的中文神经字音转换包,旨在将汉字转换为拼音,方便语音处理和文本分析。
KAN-TTS是一个语音合成训练框架,支持用户从零开始训练自己的TTS模型,提供多种语言的模型和示例。
AnimateDiff是一个将文本生成图像模型转变为动画生成器的模块,无需额外训练,支持多种社区模型。
该仓库是基于PyTorch的实现,旨在进行可控的人物图像合成,支持姿势和外观的控制。
MetaGPT 是一个多智能体框架,旨在通过协作处理复杂任务,实现自然语言编程,尤其适合AI软件公司使用。
Telethon是一个Python 3库,专为用户和机器人账户设计,便于与Telegram API交互,支持发送消息、处理事件等功能。
sqlacodegen是一个自动生成SQLAlchemy模型代码的工具,能够根据现有数据库结构生成符合PEP 8标准的代码,支持多个关系类型和表继承。