类库 › ExtractThinker
enoch3712

enoch3712/ExtractThinker

ExtractThinker是一个基于大语言模型的文档智能处理库,提供ORM风格的交互方式,支持从PDF、图像、电子表格等多种格式文档中灵活提取和分类结构化数据。

1,524 153 1,524 34
在 GitHub 上查看

技术栈

测试

Playwright >=1.52.0 pytest ^8.2.0
查看全部依赖 (18)

依赖

NumPy ^1.26.4 Pillow Pydantic >=2.11.5 cachetools >=5.5.2 instructor >=1.8.3 libmagic * litellm >=1.71.1 pillow >=11.2.1,<12.0 pypdfium2 >=4.30.1 pytesseract python-docx python-dotenv >=1.1.0 python-magic >=0.4.27 pyyaml >=6.0.2 xlrd

开发依赖

black ^24.10.0 flake8 ^7.1.2 ipykernel ^6.29.5

评论

ホーム - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.1. UTC+08:00, 2026-04-03 12:51
浙ICP备14020137号-1 $お客様$