所有
› 关键词:"ocr"
该项目结合yolo3与ocr实现中文自然场景下的文字检测与识别,支持多种模型转换与训练,适用于身份证和火车票等结构化数据的识别。
Lepton 是一个轻量级的代码片段管理工具,支持无限的公开和私密片段,集成 GitHub Gist,适用于多种操作系统,帮助开发者高效管理代码片段。
doc2text是一个Python模块,旨在从质量较差的PDF文档中提取高质量文本,解决扫描错误,帮助科研人员获取更多有用数据。
Tesseract是一个开源的OCR引擎,支持文本识别和处理,提供命令行工具,适用于多种文档及图像格式。
Bob 是一款适用于 macOS 的翻译及 OCR 软件,提供划词翻译、截图翻译等多种翻译方式,并支持离线文本识别和语音合成。
这是一个用于自动OCR处理PDF文档、翻译输出并生成epub/PDF文件的工具集,旨在支持多语言创建。
PaddleOCR是一个基于PaddlePaddle的多语言OCR和文档解析工具,支持80多种语言的识别,提供数据标注和合成工具,适用于服务器、移动设备及嵌入式设备的训练和部署。
OCRmyPDF为扫描的PDF文件添加OCR文本层,允许搜索和复制粘贴,提升文档的可用性。
EasyOCR是一个即用型OCR库,支持80多种语言和多种书写脚本,提供便捷的文字识别功能。
chineseocr_lite是一个超轻量级中文OCR项目,支持竖排文字识别,提供多种推理方式,适用于多平台。旨在实现快速、精准的中文字符识别。


