PacifAIst/Quansloth - 在线工具

在线工具

在线工具

排行榜

反馈

文库码库小摊

更多

类库 › Quansloth

PacifAIst/Quansloth

Quansloth 是一个基于 Google TurboQuant 技术实现的本地 AI 服务器，专注于通过极致的 KV 缓存压缩来大幅降低大语言模型推理时的 GPU 内存占用。它能在消费级硬件上稳定运行超长上下文模型，实现完全的私有化、离线部署，有效避免GPU内存不足导致的崩溃。

45 4 45

在 GitHub 上查看

PacifAIst/Quansloth

标签

cuda quansloth turboquant vram-wall

截图

Interface

Interface

相关项目

评论

项目信息

语言: Python
许可证: Apache License 2.0
默认分支: main
所有者: PacifAIst User
创建时间: 2026-03-27
最近提交: 5天前
最近更新: 20小时前
收录时间: 2026-04-05

支持平台

Linux

首页 - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.1. UTC+08:00, 2026-04-06 12:47
浙ICP备14020137号-1 $访客地图$