类库 - 온라인도구

Ucas-HaoranWei/GOT-OCR2.0

GOT-OCR2.0是一个通用OCR理论的官方代码实现，提供了一种统一的端到端模型，旨在提升文本识别的效果与效率。

Python

7,807

687

2个月前

Dicklesworthstone/llm_aided_ocr

LLM-Aided OCR项目通过应用大语言模型技术，提升扫描PDF的光学字符识别（OCR）输出质量，生成准确易读的文档。

Python

2,737

188

2个月前

datalab-to/surya

Surya是一个文档OCR工具包，支持90多种语言的文字识别、布局分析、阅读顺序检测和表格识别。

Python

18,368

1,245

Other

2个月前

PantsuDango/DangoOCR

DangoOCR 是基于PaddleOCR的离线OCR服务器，主要用于图像文字识别，支持Windows系统，需配合团子翻译器使用。

Python

242

31

2个月前

PantsuDango/Dango-Translator

团子翻译器是一款基于OCR技术的翻译软件，能够实时识别文字并进行翻译，支持漫画图片的自动识别与翻译。

Python

7,794

552

GNU Lesser General Public License v2.1

2个月前

AILab-CVC/VideoCrafter

VideoCrafter是一个开源视频生成和编辑工具，支持文本转视频和图像转视频功能，旨在创造高质量的视频内容。

Python

4,938

379

Other

2个月前

HRNet/HRNet-Semantic-Segmentation

HRNet-Semantic-Segmentation是高分辨率网络与分割变换器的语义分割官方实现，支持多种预训练模型，适用于计算机视觉任务。

Python

3,265

695

Other

2个月前

lukas-blecher/LaTeX-OCR

LaTeX-OCR项目利用ViT模型将数学公式图像转换为LaTeX代码，旨在提高公式处理的效率和便捷性。

Python

15,181

1,224

MIT License

2个月前

hiroi-sora/Umi-OCR

Umi-OCR是一个免费的开源离线OCR软件，支持截图、批量图片和PDF文档识别，具有多语言识别能力，使用方便高效。

Python

36,241

3,591

MIT License

2个月前

bestcondition/image2text

image2text项目利用255种unicode字符展示图片与文本视频，不依赖OCR技术，适用于需要图像再现的用户。

Python

37

1

Apache License 2.0

6个月前

类库

文库