Todo
› Palabra clave: "ocr"
WebVideoCreator是一个基于Node.js的框架,能够将Web动画渲染为视频,支持多种动画格式,快速生成高质量视频,适合数据可视化和数字人视频制作。
logocreator 是一个开源的logo生成器,用户可以在几秒钟内创建专业的logo并进行样式定制。
TexTeller 是一个图像转LaTeX公式的模型,具备高准确率和强泛化能力,适用于多种使用场景。
GOT-OCR2.0是一个通用OCR理论的官方代码实现,提供了一种统一的端到端模型,旨在提升文本识别的效果与效率。
Zerox 是一个简单易用的文档OCR和提取工具,支持多种文件格式,将文档转化为Markdown,以便AI处理和分析。
LLM-Aided OCR项目通过应用大语言模型技术,提升扫描PDF的光学字符识别(OCR)输出质量,生成准确易读的文档。
Surya是一个文档OCR工具包,支持90多种语言的文字识别、布局分析、阅读顺序检测和表格识别。
TTime是一款简洁高效的翻译软件,支持输入、截图、划词翻译及OCR文字识别,帮助用户快速获取所需信息。
DangoOCR 是基于PaddleOCR的离线OCR服务器,主要用于图像文字识别,支持Windows系统,需配合团子翻译器使用。
团子翻译器是一款基于OCR技术的翻译软件,能够实时识别文字并进行翻译,支持漫画图片的自动识别与翻译。


