DocTr-Plus 是一个文档图像矫正工具,通过深度学习技术处理各种失真文档图像,支持在线演示和使用。
Python
479
48
Other
2个月前
EnCodec是一个基于深度学习的高保真音频压缩编码器,支持24 kHz单声道和48 kHz立体声音频,旨在实现高效音频编码。
Python
3,766
334
MIT License
2个月前
unilm是一个用于大规模自监督预训练的框架,支持语言、任务和模态的多样性,旨在提升基础模型的性能与泛化能力。
Python
21,659
2,654
MIT License
2个月前
ControlNet 1.1是一个用于研究和学术实验的深度学习框架,具有增强的稳健性和结果质量,支持各种模型组合。
Python
5,076
402
2个月前
MiniAGI是基于OpenAI API的简单通用AI代理,具备自我思考、批判和短期记忆功能,能够执行编程任务和生成多种输出。
Python
2,892
307
MIT License
2个月前
MiniGPT-4是一个开源项目,集成大型语言模型用于视听语言多任务学习,旨在增强视觉和语言理解能力。
Python
25,734
2,939
BSD 3-Clause "New" or "Revised" License
2个月前
这是一个基于深度强化学习的AI代理,旨在击败《街头霸王II冠军版》中的最终Boss,能够根据游戏画面像素值做决策。
Python
6,486
1,396
Apache License 2.0
2个月前
pix2pix3D 是一个基于PyTorch的模型,用于根据2D标签地图生成3D对象,支持用户交互式3D编辑。
Python
1,716
144
MIT License
2个月前
OSX是一个基于组件感知变换器的单阶段3D全身网格恢复的实现,支持2D关键点对齐,适用于姿势估计和图像生成任务。
Python
736
60
MIT License
2个月前
这个仓库是一个生成作图咒语的工具,支持MidJourney和Stable Diffusion等模型,通过模型生成更有效的提示语,简化用户创作过程。
Python
1,171
109
MIT License
2个月前

首页 - Wiki
Copyright © 2011-2025 iteam. Current version is 2.147.1. UTC+08:00, 2025-11-05 11:35
浙ICP备14020137号-1 $访客地图$