PacifAIst/Quansloth - Online Tools

Online Tools

Online Tools

Ranking List

反馈

Library Code Library Shop

More

类库 › Quansloth

PacifAIst/Quansloth

Quansloth 是一个基于 Google TurboQuant 技术实现的本地 AI 服务器，专注于通过极致的 KV 缓存压缩来大幅降低大语言模型推理时的 GPU 内存占用。它能在消费级硬件上稳定运行超长上下文模型，实现完全的私有化、离线部署，有效避免GPU内存不足导致的崩溃。

94 11 94

在 GitHub 上查看

PacifAIst/Quansloth

标签

cuda quansloth turboquant vram-wall

技术栈

根目录 python

查看全部依赖 (3)

依赖

PyPDF2 gradio openai

截图

Interface

相关项目

评论

项目信息

语言: Python
许可证: Apache License 2.0
默认分支: main
所有者: PacifAIst User
创建时间: 2026-03-27
最近提交: 2周前
最近更新: 3天前
收录时间: 2026-04-05

支持平台

Linux

Home - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.1. UTC+08:00, 2026-04-27 03:37
浙ICP备14020137号-1 $Map of visitor$