类库
› pdf2any
ayang/pdf2any
pdf2any是一个Python库,用于将PDF转换为DOCX、HTML和Markdown格式。支持提取文本、表格和图片,保留文档结构,并提供命令行和API接口,适用于批量处理和大型文档转换。
技术栈
根目录 python
查看全部依赖 (8)
依赖
NumPy
Pillow
PyMuPDF
fire
fonttools
lxml
opencv-python
python-docx