所有 › 关键词:"ocr"
TexTeller 是一个图像转LaTeX公式的模型,具备高准确率和强泛化能力,适用于多种使用场景。
Python
583
65
Apache License 2.0
2个月前
GOT-OCR2.0是一个通用OCR理论的官方代码实现,提供了一种统一的端到端模型,旨在提升文本识别的效果与效率。
Python
7,807
687
2个月前
Zerox 是一个简单易用的文档OCR和提取工具,支持多种文件格式,将文档转化为Markdown,以便AI处理和分析。
TypeScript
11,788
801
MIT License
2个月前
LLM-Aided OCR项目通过应用大语言模型技术,提升扫描PDF的光学字符识别(OCR)输出质量,生成准确易读的文档。
Python
2,737
188
2个月前
Surya是一个文档OCR工具包,支持90多种语言的文字识别、布局分析、阅读顺序检测和表格识别。
Python
18,368
1,245
Other
2个月前
TTime是一款简洁高效的翻译软件,支持输入、截图、划词翻译及OCR文字识别,帮助用户快速获取所需信息。
TypeScript
3,031
175
Other
2个月前
DangoOCR 是基于PaddleOCR的离线OCR服务器,主要用于图像文字识别,支持Windows系统,需配合团子翻译器使用。
Python
242
31
2个月前
团子翻译器是一款基于OCR技术的翻译软件,能够实时识别文字并进行翻译,支持漫画图片的自动识别与翻译。
Python
7,794
552
GNU Lesser General Public License v2.1
2个月前
VideoCrafter是一个开源视频生成和编辑工具,支持文本转视频和图像转视频功能,旨在创造高质量的视频内容。
Python
4,938
379
Other
2个月前
C-OCR是携程自研的OCR项目,专注于识别身份证、护照、火车票和签证等旅游相关证件。
Java
2,461
626
2个月前

首页 - Wiki
Copyright © 2011-2025 iteam. Current version is 2.147.1. UTC+08:00, 2025-11-04 14:10
浙ICP备14020137号-1 $访客地图$