类库 - 在线工具

chineseocr/chineseocr

该项目结合yolo3与ocr实现中文自然场景下的文字检测与识别，支持多种模型转换与训练，适用于身份证和火车票等结构化数据的识别。

Python

6,094

1,730

MIT License

2个月前

hackjutsu/Lepton

Lepton 是一个轻量级的代码片段管理工具，支持无限的公开和私密片段，集成 GitHub Gist，适用于多种操作系统，帮助开发者高效管理代码片段。

JavaScript

10,249

475

MIT License

2个月前

jlsutherland/doc2text

doc2text是一个Python模块，旨在从质量较差的PDF文档中提取高质量文本，解决扫描错误，帮助科研人员获取更多有用数据。

Python

1,274

103

MIT License

4个月前

tesseract-ocr/tesseract

Tesseract是一个开源的OCR引擎，支持文本识别和处理，提供命令行工具，适用于多种文档及图像格式。

C++

69,021

10,140

Apache License 2.0

2个月前

ripperhe/Bob

Bob 是一款适用于 macOS 的翻译及 OCR 软件，提供划词翻译、截图翻译等多种翻译方式，并支持离线文本识别和语音合成。

9,405

523

2个月前

jenh/epub-ocr-and-translate

这是一个用于自动OCR处理PDF文档、翻译输出并生成epub/PDF文件的工具集，旨在支持多语言创建。

Python

43

4

MIT License

6个月前

PaddlePaddle/PaddleOCR

PaddleOCR是一个基于PaddlePaddle的多语言OCR和文档解析工具，支持80多种语言的识别，提供数据标注和合成工具，适用于服务器、移动设备及嵌入式设备的训练和部署。

Python

52,955

8,539

Apache License 2.0

2个月前

ocrmypdf/OCRmyPDF

OCRmyPDF为扫描的PDF文件添加OCR文本层，允许搜索和复制粘贴，提升文档的可用性。

Python

30,920

2,139

Mozilla Public License 2.0

2个月前

JaidedAI/EasyOCR

EasyOCR是一个即用型OCR库，支持80多种语言和多种书写脚本，提供便捷的文字识别功能。

Python

27,709

3,450

Apache License 2.0

2个月前

DayBreak-u/chineseocr_lite

chineseocr_lite是一个超轻量级中文OCR项目，支持竖排文字识别，提供多种推理方式，适用于多平台。旨在实现快速、精准的中文字符识别。

C++

12,185

2,295

GNU General Public License v2.0

2个月前

类库

文库