类库 - công cụ trực tuyến

fh2019ustc/DocScanner

DocScanner是一个基于PyTorch的文档图像矫正工具，使用渐进学习方法提升图像质量，支持在线演示和上传功能。

Python

238

21

Other

2个月前

fh2019ustc/DocTr

DocTr是一个用于文档图像几何校正与光照修正的工具，提供了简单易用的在线演示，帮助用户处理变形的文档图像。

Python

401

55

Other

2个月前

fh2019ustc/DocTr-Plus

DocTr-Plus 是一个文档图像矫正工具，通过深度学习技术处理各种失真文档图像，支持在线演示和使用。

Python

479

48

Other

2个月前

facebookresearch/encodec

EnCodec是一个基于深度学习的高保真音频压缩编码器，支持24 kHz单声道和48 kHz立体声音频，旨在实现高效音频编码。

Python

3,766

334

MIT License

2个月前

microsoft/unilm

unilm是一个用于大规模自监督预训练的框架，支持语言、任务和模态的多样性，旨在提升基础模型的性能与泛化能力。

Python

21,659

2,654

MIT License

2个月前

lllyasviel/ControlNet-v1-1-nightly

ControlNet 1.1是一个用于研究和学术实验的深度学习框架，具有增强的稳健性和结果质量，支持各种模型组合。

Python

5,076

402

2个月前

muellerberndt/mini-agi

MiniAGI是基于OpenAI API的简单通用AI代理，具备自我思考、批判和短期记忆功能，能够执行编程任务和生成多种输出。

Python

2,892

307

MIT License

2个月前

Vision-CAIR/MiniGPT-4

MiniGPT-4是一个开源项目，集成大型语言模型用于视听语言多任务学习，旨在增强视觉和语言理解能力。

Python

25,734

2,939

BSD 3-Clause "New" or "Revised" License

2个月前

linyiLYi/street-fighter-ai

这是一个基于深度强化学习的AI代理，旨在击败《街头霸王II冠军版》中的最终Boss，能够根据游戏画面像素值做决策。

Python

6,486

1,396

Apache License 2.0

2个月前

dunbar12138/pix2pix3D

pix2pix3D 是一个基于PyTorch的模型，用于根据2D标签地图生成3D对象，支持用户交互式3D编辑。

Python

1,716

144

MIT License

2个月前

类库

文库