所有
› 语言:Python ×
› 关键词:"ocr"
Texo是一个开源的超轻量级LaTeX公式识别模型,具有20M参数,支持在浏览器中运行,专为STEM和AI学习者提供高效的OCR工具。
Chandra是一个高精度的OCR模型,支持将图片和PDF转换为结构化的HTML、Markdown或JSON,同时保留布局信息,具备良好的表单和手写识别能力。
DeekSeek-OCR是一个强大的OCR解决方案,能将PDF文档转换为Markdown格式,支持批处理和REST API调用,便于文档处理。
File Wizard是一个自托管的Web工具,用于文件格式转换、OCR、音频转录及文本转语音,支持多种文件处理工具,界面简洁易用。
Papermerge是一个开源文档管理系统,专为扫描文档设计,支持OCR文本提取和全文搜索。适用于长期存储数字档案。
ComboOCR是一个基于深度学习的高精度文本识别系统,集成了多种先进模型,支持图像文本识别和图像增强,适用于文档处理。
OCRAutoScore是一个基于Python的OCR自动化阅卷项目,通过图像识别技术自动评估试卷,支持多种语言并提供模块化开发接口。
ColiVara是一个文档存储和检索服务,基于视觉嵌入技术实现先进的文本和视觉文档检索,无需OCR或文本提取。
DocStrange用于智能提取和转换各种文档(如PDF、Word、图片等)中的数据,并支持多种格式(Markdown、JSON等),方便用户处理和利用文档信息。
text-extract-api 是一个文档提取与解析API,支持将PDF、Word及PPTX等文件转换为高精度的Markdown或JSON格式,具备去除个人识别信息功能。


