类库 › llm-compressor
vllm-project

vllm-project/llm-compressor

LLM Compressor是用于优化大语言模型部署的Python库,支持量化算法与vLLM无缝集成。它兼容Hugging Face模型,可将模型保存为compressed-tensors格式,并支持DDP和磁盘卸载以压缩超大模型,旨在提升推理效率。

3,223 514 3,223 123
在 GitHub 上查看

评论

- 위키
Copyright © 2011-2026 iteam. Current version is 2.155.2. UTC+08:00, 2026-05-16 02:31
浙ICP备14020137号-1 $방문자$