类库 › KVarN
huawei-csl

huawei-csl/KVarN

KVarN是vLLM的原生KV缓存量化后端,无需校准且仅需一个标志即可启用。它提供3-5倍上下文容量和高于FP16的吞吐量,同时保持FP16级精度,专为智能体和长上下文工作负载设计,显著提升并发处理能力。

huawei-csl/KVarN

技术栈

rust/src/cmd rust

查看全部依赖 (1)

依赖

native-tls-vendored

rust/src/engine-core-client rust

查看全部依赖 (1)

依赖

tempfile

截图

imgs/pareto_qwen3-32b.png
imgs/kvarn_pipeline.gif

评论

Главная - Вики-сайт
Copyright © 2011-2026 iteam. Current version is 2.155.2. UTC+08:00, 2026-06-08 19:28
浙ICP备14020137号-1 $Гость$