类库 › airllm
lyogavin

lyogavin/airllm

AirLLM是一个优化大语言模型推理内存使用的项目,允许70B参数模型在单张4GB显存的GPU上运行,无需量化、蒸馏或剪枝。它支持在资源受限的环境中高效部署和运行大型模型,目前还能在8GB显存上运行405B参数的Llama3.1。

16,490 1,739 16,490 147
在 GitHub 上查看

技术栈

根目录 python

查看全部依赖 (9)

依赖

accelerate bitsandbytes einops evaluate peft scikit-learn sentencepiece transformers wandb

截图

speed_improvement
"Buy Me A Coffee"

评论

trang chủ - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.1. UTC+08:00, 2026-04-23 20:45
浙ICP备14020137号-1 $bản đồ khách truy cập$