类库 - 在线工具

HRNet/HRNet-Semantic-Segmentation

HRNet-Semantic-Segmentation是高分辨率网络与分割变换器的语义分割官方实现，支持多种预训练模型，适用于计算机视觉任务。

Python

3,265

695

Other

2个月前

lukas-blecher/LaTeX-OCR

LaTeX-OCR项目利用ViT模型将数学公式图像转换为LaTeX代码，旨在提高公式处理的效率和便捷性。

Python

15,181

1,224

MIT License

2个月前

hiroi-sora/Umi-OCR

Umi-OCR是一个免费的开源离线OCR软件，支持截图、批量图片和PDF文档识别，具有多语言识别能力，使用方便高效。

Python

36,241

3,591

MIT License

2个月前

zlyBear/BearOCR

BearOCR是一个基于OpenCV的iOS项目，用于实现图片中文字区域的识别和提取，旨在探索和实现OCR功能。

Objective-C

112

25

2个月前

freyjaSubOCR/freyja-sub-ocr-electron

Freyja是一个基于Nodejs和Electron的用户界面，旨在提取字幕的OCR工具，仍处于测试阶段，功能可用，但可能存在bug。

Vue

41

2

GNU General Public License v3.0

1年前

bestcondition/image2text

image2text项目利用255种unicode字符展示图片与文本视频，不依赖OCR技术，适用于需要图像再现的用户。

Python

37

1

Apache License 2.0

6个月前

YaoFANGUK/video-subtitle-extractor

video-subtitle-extractor 是一款视频硬字幕提取工具，能将视频中的硬字幕识别并生成为srt文件，支持多语言和批量提取，采用本地OCR，无需API，适用于各种视频。

Python

7,759

811

Apache License 2.0

2个月前

guanshuicheng/invoice

该仓库提供增值税发票的高精度识别功能，基于Flask微服务架构，支持多种类型发票的OCR识别，可进行数据相关合作。

C

1,928

458

MIT License

2个月前

chineseocr/chineseocr

该项目结合yolo3与ocr实现中文自然场景下的文字检测与识别，支持多种模型转换与训练，适用于身份证和火车票等结构化数据的识别。

Python

6,094

1,730

MIT License

2个月前

hackjutsu/Lepton

Lepton 是一个轻量级的代码片段管理工具，支持无限的公开和私密片段，集成 GitHub Gist，适用于多种操作系统，帮助开发者高效管理代码片段。

JavaScript

10,249

475

MIT License

2个月前

类库

文库