所有
                                                    › 关键词:"ocr"
                            
        
        
                
        
        
                    
                                    HRNet-Semantic-Segmentation是高分辨率网络与分割变换器的语义分割官方实现,支持多种预训练模型,适用于计算机视觉任务。                                
                                
                                
                            
                                    LaTeX-OCR项目利用ViT模型将数学公式图像转换为LaTeX代码,旨在提高公式处理的效率和便捷性。                                
                                
                                
                            
                                    Umi-OCR是一个免费的开源离线OCR软件,支持截图、批量图片和PDF文档识别,具有多语言识别能力,使用方便高效。                                
                                
                                
                            
                                    BearOCR是一个基于OpenCV的iOS项目,用于实现图片中文字区域的识别和提取,旨在探索和实现OCR功能。                                
                                
                                
                            
                                    Freyja是一个基于Nodejs和Electron的用户界面,旨在提取字幕的OCR工具,仍处于测试阶段,功能可用,但可能存在bug。                                
                                
                                
                            
                                    image2text项目利用255种unicode字符展示图片与文本视频,不依赖OCR技术,适用于需要图像再现的用户。                                
                                
                                
                            
                                    video-subtitle-extractor 是一款视频硬字幕提取工具,能将视频中的硬字幕识别并生成为srt文件,支持多语言和批量提取,采用本地OCR,无需API,适用于各种视频。                                
                                
                                
                            
                                    该仓库提供增值税发票的高精度识别功能,基于Flask微服务架构,支持多种类型发票的OCR识别,可进行数据相关合作。                                
                                
                                
                            
                                    该项目结合yolo3与ocr实现中文自然场景下的文字检测与识别,支持多种模型转换与训练,适用于身份证和火车票等结构化数据的识别。                                
                                
                                
                            
                                    Lepton 是一个轻量级的代码片段管理工具,支持无限的公开和私密片段,集成 GitHub Gist,适用于多种操作系统,帮助开发者高效管理代码片段。                                
                                
                                
                            

