lyogavin/airllm - công cụ trực tuyến

công cụ trực tuyến

công cụ trực tuyến

bảng xếp hạng

反馈

công cụ trực tuyến

trang chủ chủ đề

thư viện mã nguồn cửa hàng

thêm

类库 › airllm

lyogavin/airllm

AirLLM是一个优化大语言模型推理内存使用的项目，允许70B参数模型在单张4GB显存的GPU上运行，无需量化、蒸馏或剪枝。它支持在资源受限的环境中高效部署和运行大型模型，目前还能在8GB显存上运行405B参数的Llama3.1。

16,490 1,739 16,490 147

在 GitHub 上查看

标签

chinese-llm chinese-nlp finetune generative-ai instruct-gpt instruction-set llama llm lora open-models open-source open-source-models qlora

技术栈

根目录 python

查看全部依赖 (9)

依赖

accelerate bitsandbytes einops evaluate peft scikit-learn sentencepiece transformers wandb

截图

speed_improvement

"Buy Me A Coffee"

相关项目

评论

项目信息

语言: Jupyter Notebook
许可证: Apache License 2.0
默认分支: main
所有者: lyogavin User
创建时间: 2023-06-12
最近提交: 1个月前
最近更新: 4天前
收录时间: 2026-04-12

支持平台

Linux Windows Mac Docker CLI

trang chủ - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.1. UTC+08:00, 2026-04-23 20:45
浙ICP备14020137号-1 $bản đồ khách truy cập$