类库 › airllm
lyogavin

lyogavin/airllm

AirLLM是一个优化大语言模型推理内存使用的项目,允许70B参数模型在单张4GB显存的GPU上运行,无需量化、蒸馏或剪枝。它支持在资源受限的环境中高效部署和运行大型模型,目前还能在8GB显存上运行405B参数的Llama3.1。

19,288 2,114 19,288 159
在 GitHub 上查看

技术栈

根目录 python

查看全部依赖 (9)

依赖

accelerate bitsandbytes einops evaluate peft scikit-learn sentencepiece transformers wandb

截图

"Buy Me A Coffee"

评论

- 위키
Copyright © 2011-2026 iteam. Current version is 2.155.2. UTC+08:00, 2026-06-13 17:43
浙ICP备14020137号-1 $방문자$