Whisper是一个通用的语音识别模型,能够进行多语言识别、语音翻译和语言识别,基于大规模弱监督训练。
Harmonizer是一个高分辨率图像和视频协调模型,支持8K分辨率,适用于实时图像增强与和谐处理。
colab-convert工具可将.py与.ipynb格式互换,支持将Google Colab笔记本转为可运行的Python代码,并反向转换,便于用户在不同环境中使用。
Gradio是一个用Python构建和分享机器学习应用的工具,简单易用,适合快速创建AI应用。
这是一个用于Stable Diffusion WebUI的ControlNet扩展,支持动态图像生成,并简化了控制模型的集成过程。
该仓库为AUTOMATIC1111的Stable Diffusion web UI提供了一种扩展,允许用户使用LoRA模型生成图像,无需合并即可实时添加网络。
EasyNLP是一个易用的自然语言处理工具包,支持分布式训练与多种算法,旨在简化NLP开发与应用。
CTRNet是一个用于文本去除的背景恢复算法实现,通过建模局部和全局上下文,实现精确的背景重建。
ControlNet是一个神经网络结构,通过添加额外条件来控制扩散模型,方便在小规模数据集上进行训练而不破坏原有模型。
SimBERT是一个基于UniLM思想的BERT模型,结合了检索与生成任务,旨在提高相似句子的生成与理解能力。