类库 - herramientas en línea

kyryl-opens-ml/no-ocr

No OCR是一个简化的AI文档处理工具，通过上传文件快速搜索和提问，无需复杂的文本提取，支持PDF文档集合管理和向量搜索。

TypeScript

164

21

Apache License 2.0

2个月前

ses4255/Versatile-OCR-Program

这是一个多模态OCR系统，旨在从复杂的教育材料中提取结构化数据，支持各类文本和图表，优化机器学习训练。

Python

664

47

Other

2个月前

ppaanngggg/layoutreader

LayoutReader是一个基于LayoutLMv3的高效模型，用于排序OCR框的阅读顺序，优化了文档解析和多语言处理。

Python

270

20

Other

2个月前

Stx666Michael/DocumentDenoise

DocumentDenoise是一个用于OCR研究项目的文档去噪工具，采用深度学习方法，如自编码器和CycleGAN，提升图像质量。

Jupyter Notebook

7

0

7个月前

hpcaitech/Open-Sora

Open-Sora旨在以高效方式制作高质量视频，提供开放源代码工具，简化视频生成复杂性，促进创意与创新。

Python

27,059

2,660

Apache License 2.0

2个月前

Agions/VisionSub

VisionSub 是一款高效的视频硬字幕提取工具，支持从视频中提取字幕并导出为多种格式，如 SRT 和 JSON，具有实时预览和强大OCR功能。

Python

9

1

MIT License

2个月前

sml2h3/ddddocr

DdddOcr是一个开源的Python库，用于离线识别通用验证码，旨在提供简单易用的OCR解决方案，支持自定义模型和HTTP API服务。

Python

12,537

2,067

MIT License

2个月前

allenai/olmocr

olmocr是一个工具包，用于将PDF和其他基于图像的文档格式转换为干净、可读的纯文本格式，支持复杂排版与数学公式。

Python

13,893

1,028

Apache License 2.0

2个月前

imanoop7/Ollama-OCR

Ollama-OCR是一个强大的光学字符识别工具，利用先进的视觉语言模型从图像和PDF中提取文本，支持多种输出格式与批量处理。

Jupyter Notebook

1,987

226

MIT License

2个月前

faustomorales/keras-ocr

keras-ocr是一个封装灵活的文本检测和识别模型，结合CRAFT文本检测器和Keras CRNN，提供高层API以简化文本识别管道的训练和使用。

Python

1,461

371

MIT License

2个月前

类库

文库