类库
› Ollama-OCR
imanoop7/Ollama-OCR
Ollama-OCR是一个强大的光学字符识别工具,利用先进的视觉语言模型从图像和PDF中提取文本,支持多种输出格式与批量处理。
技术栈
根目录 python
网络
Requests
查看全部依赖 (9)
依赖
NumPy
Pillow
opencv-python
pdf2image
pymupdf
python-magic
streamlit
tqdm
transformers