lightseekorg/tokenspeed

온라인도구

온라인도구

순위 목록

反馈

온라인도구

홈 항목

글 코드베이스 상점

자세히

类库 › tokenspeed

lightseekorg/tokenspeed

TokenSpeed是一个专为AI agent任务设计的高性能LLM推理引擎，在保证TensorRT-LLM级别性能的同时提供类似vLLM的易用性。它采用本地SPMD架构和静态编译，用户无需手动编写并行逻辑，并通过C++调度器和分层内核系统实现高效推理，尤其针对Blackwell平台优化了MLA（多头潜在注意力）实现。

1,001 84 1,001 14

在 GitHub 上查看