Todo › Palabra clave: "ocr"
No OCR是一个简化的AI文档处理工具,通过上传文件快速搜索和提问,无需复杂的文本提取,支持PDF文档集合管理和向量搜索。
TypeScript
164
21
Apache License 2.0
2个月前
这是一个多模态OCR系统,旨在从复杂的教育材料中提取结构化数据,支持各类文本和图表,优化机器学习训练。
Python
664
47
Other
2个月前
LayoutReader是一个基于LayoutLMv3的高效模型,用于排序OCR框的阅读顺序,优化了文档解析和多语言处理。
Python
270
20
Other
2个月前
DocumentDenoise是一个用于OCR研究项目的文档去噪工具,采用深度学习方法,如自编码器和CycleGAN,提升图像质量。
Jupyter Notebook
7
0
7个月前
Open-Sora旨在以高效方式制作高质量视频,提供开放源代码工具,简化视频生成复杂性,促进创意与创新。
Python
27,059
2,660
Apache License 2.0
2个月前
VisionSub 是一款高效的视频硬字幕提取工具,支持从视频中提取字幕并导出为多种格式,如 SRT 和 JSON,具有实时预览和强大OCR功能。
Python
9
1
MIT License
2个月前
DdddOcr是一个开源的Python库,用于离线识别通用验证码,旨在提供简单易用的OCR解决方案,支持自定义模型和HTTP API服务。
Python
12,537
2,067
MIT License
2个月前
olmocr是一个工具包,用于将PDF和其他基于图像的文档格式转换为干净、可读的纯文本格式,支持复杂排版与数学公式。
Python
13,893
1,028
Apache License 2.0
2个月前
Ollama-OCR是一个强大的光学字符识别工具,利用先进的视觉语言模型从图像和PDF中提取文本,支持多种输出格式与批量处理。
Jupyter Notebook
1,987
226
MIT License
2个月前
keras-ocr是一个封装灵活的文本检测和识别模型,结合CRAFT文本检测器和Keras CRNN,提供高层API以简化文本识别管道的训练和使用。
Python
1,461
371
MIT License
2个月前

inicio - Wiki
Copyright © 2011-2025 iteam. Current version is 2.147.1. UTC+08:00, 2025-11-09 06:45
浙ICP备14020137号-1 $mapa de visitantes$