Graphtage是一个命令行工具和库,用于语义比较和合并树状结构文件,如JSON、XML和YAML,便于用户高效管理和比较文件变更。
gdown是一个用于从Google Drive下载公共文件的工具,能跳过安全提示并支持递归下载。
Deep Lake是一个AI数据库,旨在存储、查询和可视化各类AI数据,如矢量、图像和文本,并支持PyTorch/TensorFlow实时流数据。
Svglib是一个纯Python库,用于读取SVG文件并将其转换为其他格式,主要利用ReportLab工具包实现此功能。
PaddleOCR是一个基于PaddlePaddle的多语言OCR和文档解析工具,支持80多种语言的识别,提供数据标注和合成工具,适用于服务器、移动设备及嵌入式设备的训练和部署。
OCRmyPDF为扫描的PDF文件添加OCR文本层,允许搜索和复制粘贴,提升文档的可用性。
该仓库实现了基于BERT和ERNIE的中文文本分类,支持快速训练和测试,同时提供了数据集和预训练模型下载。
pikepdf是一个Python库,旨在读取和写入PDF文件,基于强大的PDF处理库qpdf,适合进行PDF编辑和内容转换。
H2O Wave 是一个用于构建基于浏览器的实时应用和仪表盘的软件栈,支持 Python 和 R,无需使用 HTML、JavaScript 或 CSS。
背景抠图工具,支持实时高分辨率的背景分离,适用于视频处理,特别对Nvidia RTX 2080 TI显卡优化。