类库 › Quansloth
PacifAIst

PacifAIst/Quansloth

Quansloth 是一个基于 Google TurboQuant 技术实现的本地 AI 服务器,专注于通过极致的 KV 缓存压缩来大幅降低大语言模型推理时的 GPU 内存占用。它能在消费级硬件上稳定运行超长上下文模型,实现完全的私有化、离线部署,有效避免GPU内存不足导致的崩溃。

PacifAIst/Quansloth

技术栈

根目录 python

查看全部依赖 (3)

依赖

PyPDF2 gradio openai

截图

Interface

评论

Home - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.1. UTC+08:00, 2026-04-27 03:37
浙ICP备14020137号-1 $Map of visitor$