所有
› 关键词:"ocr"
C-OCR是携程自研的OCR项目,专注于识别身份证、护照、火车票和签证等旅游相关证件。
HRNet-Semantic-Segmentation是高分辨率网络与分割变换器的语义分割官方实现,支持多种预训练模型,适用于计算机视觉任务。
LaTeX-OCR项目利用ViT模型将数学公式图像转换为LaTeX代码,旨在提高公式处理的效率和便捷性。
Umi-OCR是一个免费的开源离线OCR软件,支持截图、批量图片和PDF文档识别,具有多语言识别能力,使用方便高效。
BearOCR是一个基于OpenCV的iOS项目,用于实现图片中文字区域的识别和提取,旨在探索和实现OCR功能。
Freyja是一个基于Nodejs和Electron的用户界面,旨在提取字幕的OCR工具,仍处于测试阶段,功能可用,但可能存在bug。
image2text项目利用255种unicode字符展示图片与文本视频,不依赖OCR技术,适用于需要图像再现的用户。
video-subtitle-extractor 是一款视频硬字幕提取工具,能将视频中的硬字幕识别并生成为srt文件,支持多语言和批量提取,采用本地OCR,无需API,适用于各种视频。
该仓库提供增值税发票的高精度识别功能,基于Flask微服务架构,支持多种类型发票的OCR识别,可进行数据相关合作。
该项目结合yolo3与ocr实现中文自然场景下的文字检测与识别,支持多种模型转换与训练,适用于身份证和火车票等结构化数据的识别。


