类库
› ExtractThinker
enoch3712/ExtractThinker
ExtractThinker是一个基于大语言模型的文档智能处理库,提供ORM风格的交互方式,支持从PDF、图像、电子表格等多种格式文档中灵活提取和分类结构化数据。
标签
技术栈
测试
Playwright
>=1.52.0
pytest
^8.2.0
查看全部依赖 (18)
依赖
NumPy
^1.26.4
Pillow
Pydantic
>=2.11.5
cachetools
>=5.5.2
instructor
>=1.8.3
libmagic
*
litellm
>=1.71.1
pillow
>=11.2.1,<12.0
pypdfium2
>=4.30.1
pytesseract
python-docx
python-dotenv
>=1.1.0
python-magic
>=0.4.27
pyyaml
>=6.0.2
xlrd
开发依赖
black
^24.10.0
flake8
^7.1.2
ipykernel
^6.29.5