类库 › tokenspeed
lightseekorg

lightseekorg/tokenspeed

TokenSpeed是一个专为AI agent任务设计的高性能LLM推理引擎,在保证TensorRT-LLM级别性能的同时提供类似vLLM的易用性。它采用本地SPMD架构和静态编译,用户无需手动编写并行逻辑,并通过C++调度器和分层内核系统实现高效推理,尤其针对Blackwell平台优化了MLA(多头潜在注意力)实现。

lightseekorg/tokenspeed

截图

./assets/banner/tokenspeed-banner.png
./assets/perf/tokenspeed-kimi-k2.5-performance.png

评论

Accueil - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.2. UTC+08:00, 2026-05-10 09:47
浙ICP备14020137号-1 $Carte des visiteurs$