DocTr是一个用于文档图像几何校正与光照修正的工具,提供了简单易用的在线演示,帮助用户处理变形的文档图像。
DocTr-Plus 是一个文档图像矫正工具,通过深度学习技术处理各种失真文档图像,支持在线演示和使用。
EnCodec是一个基于深度学习的高保真音频压缩编码器,支持24 kHz单声道和48 kHz立体声音频,旨在实现高效音频编码。
unilm是一个用于大规模自监督预训练的框架,支持语言、任务和模态的多样性,旨在提升基础模型的性能与泛化能力。
ControlNet 1.1是一个用于研究和学术实验的深度学习框架,具有增强的稳健性和结果质量,支持各种模型组合。
MiniAGI是基于OpenAI API的简单通用AI代理,具备自我思考、批判和短期记忆功能,能够执行编程任务和生成多种输出。
MiniGPT-4是一个开源项目,集成大型语言模型用于视听语言多任务学习,旨在增强视觉和语言理解能力。
这是一个基于深度强化学习的AI代理,旨在击败《街头霸王II冠军版》中的最终Boss,能够根据游戏画面像素值做决策。
pix2pix3D 是一个基于PyTorch的模型,用于根据2D标签地图生成3D对象,支持用户交互式3D编辑。
OSX是一个基于组件感知变换器的单阶段3D全身网格恢复的实现,支持2D关键点对齐,适用于姿势估计和图像生成任务。


