Tất cả
                                    › Ngôn ngữ: Python ×
                                                    › Từ khóa: "ocr"
                            
        
        
                
        
        
                    
                                    GOT-OCR2.0是一个通用OCR理论的官方代码实现,提供了一种统一的端到端模型,旨在提升文本识别的效果与效率。                                
                                
                                
                            
                                    LLM-Aided OCR项目通过应用大语言模型技术,提升扫描PDF的光学字符识别(OCR)输出质量,生成准确易读的文档。                                
                                
                                
                            
                                    Surya是一个文档OCR工具包,支持90多种语言的文字识别、布局分析、阅读顺序检测和表格识别。                                
                                
                                
                            
                                    DangoOCR 是基于PaddleOCR的离线OCR服务器,主要用于图像文字识别,支持Windows系统,需配合团子翻译器使用。                                
                                
                                
                            
                                    团子翻译器是一款基于OCR技术的翻译软件,能够实时识别文字并进行翻译,支持漫画图片的自动识别与翻译。                                
                                
                                
                            
                                    VideoCrafter是一个开源视频生成和编辑工具,支持文本转视频和图像转视频功能,旨在创造高质量的视频内容。                                
                                
                                
                            
                                    HRNet-Semantic-Segmentation是高分辨率网络与分割变换器的语义分割官方实现,支持多种预训练模型,适用于计算机视觉任务。                                
                                
                                
                            
                                    LaTeX-OCR项目利用ViT模型将数学公式图像转换为LaTeX代码,旨在提高公式处理的效率和便捷性。                                
                                
                                
                            
                                    Umi-OCR是一个免费的开源离线OCR软件,支持截图、批量图片和PDF文档识别,具有多语言识别能力,使用方便高效。                                
                                
                                
                            
                                    image2text项目利用255种unicode字符展示图片与文本视频,不依赖OCR技术,适用于需要图像再现的用户。                                
                                
                                
                            

