类库 › pymupdf4llm
pymupdf

pymupdf/pymupdf4llm

PyMuPDF4LLM是一个Python库,专门将PDF文档转换为结构化的Markdown格式,优化给大型语言模型(LLM)使用。它能智能检测文档结构(如标题、表格、图像),提取内容并保持语义布局,便于在RAG等场景中处理PDF数据。

1,801 220 1,801 35
在 GitHub 上查看
pymupdf/pymupdf4llm

评论

首页 - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.2. UTC+08:00, 2026-06-06 08:28
浙ICP备14020137号-1 $访客地图$