类库
› KVarN
huawei-csl/KVarN
KVarN是vLLM的原生KV缓存量化后端,无需校准且仅需一个标志即可启用。它提供3-5倍上下文容量和高于FP16的吞吐量,同时保持FP16级精度,专为智能体和长上下文工作负载设计,显著提升并发处理能力。
技术栈
rust/src/cmd rust
查看全部依赖 (1)
依赖
native-tls-vendored
rust/src/engine-core-client rust
查看全部依赖 (1)
依赖
tempfile
截图