类库 › distributed-llama
b4rtaz

b4rtaz/distributed-llama

Distributed Llama是一个分布式大语言模型推理框架,可将多台家庭设备连接成集群,通过张量并行和以太网高速同步技术加速LLM推理。支持多种模型,包括Llama和Qwen系列,并提供CPU、GPU及Vulkan后端支持。

2,910 226 2,910 46
在 GitHub 上查看

技术栈

查看全部依赖 (5)

依赖

NumPy safetensors sentencepiece torch transformers

评论

ホーム - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.2. UTC+08:00, 2026-05-02 15:04
浙ICP备14020137号-1 $お客様$