类库 › KVarN
huawei-csl

huawei-csl/KVarN

KVarN是vLLM的原生KV缓存量化后端,无需校准且仅需一个标志即可启用。它提供3-5倍上下文容量和高于FP16的吞吐量,同时保持FP16级精度,专为智能体和长上下文工作负载设计,显著提升并发处理能力。

huawei-csl/KVarN

技术栈

rust/src/cmd rust

查看全部依赖 (1)

依赖

native-tls-vendored

rust/src/engine-core-client rust

查看全部依赖 (1)

依赖

tempfile

评论

Accueil - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.2. UTC+08:00, 2026-06-15 18:38
浙ICP备14020137号-1 $Carte des visiteurs$