전체언어: Python × › 키워드: "ocr"
GOT-OCR2.0是一个通用OCR理论的官方代码实现,提供了一种统一的端到端模型,旨在提升文本识别的效果与效率。
Python
7,807
687
2个月前
LLM-Aided OCR项目通过应用大语言模型技术,提升扫描PDF的光学字符识别(OCR)输出质量,生成准确易读的文档。
Python
2,737
188
2个月前
Surya是一个文档OCR工具包,支持90多种语言的文字识别、布局分析、阅读顺序检测和表格识别。
Python
18,368
1,245
Other
2个月前
DangoOCR 是基于PaddleOCR的离线OCR服务器,主要用于图像文字识别,支持Windows系统,需配合团子翻译器使用。
Python
242
31
2个月前
团子翻译器是一款基于OCR技术的翻译软件,能够实时识别文字并进行翻译,支持漫画图片的自动识别与翻译。
Python
7,794
552
GNU Lesser General Public License v2.1
2个月前
VideoCrafter是一个开源视频生成和编辑工具,支持文本转视频和图像转视频功能,旨在创造高质量的视频内容。
Python
4,938
379
Other
2个月前
HRNet-Semantic-Segmentation是高分辨率网络与分割变换器的语义分割官方实现,支持多种预训练模型,适用于计算机视觉任务。
Python
3,265
695
Other
2个月前
LaTeX-OCR项目利用ViT模型将数学公式图像转换为LaTeX代码,旨在提高公式处理的效率和便捷性。
Python
15,181
1,224
MIT License
2个月前
Umi-OCR是一个免费的开源离线OCR软件,支持截图、批量图片和PDF文档识别,具有多语言识别能力,使用方便高效。
Python
36,241
3,591
MIT License
2个月前
image2text项目利用255种unicode字符展示图片与文本视频,不依赖OCR技术,适用于需要图像再现的用户。
Python
37
1
Apache License 2.0
6个月前

- 위키
Copyright © 2011-2025 iteam. Current version is 2.147.1. UTC+08:00, 2025-11-04 20:11
浙ICP备14020137号-1 $방문자$