类库 › llm-compressor
vllm-project

vllm-project/llm-compressor

LLM Compressor是用于优化大语言模型部署的Python库,支持量化算法与vLLM无缝集成。它兼容Hugging Face模型,可将模型保存为compressed-tensors格式,并支持DDP和磁盘卸载以压缩超大模型,旨在提升推理效率。

3,329 539 3,329 137
在 GitHub 上查看

评论

首页 - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.2. UTC+08:00, 2026-06-14 02:45
浙ICP备14020137号-1 $访客地图$