类库 › cactus
cactus-compute

cactus-compute/cactus

Cactus是一个针对移动设备和可穿戴设备的低延迟、高能效AI推理引擎。它提供OpenAI兼容的API接口,支持聊天、视觉、语音识别(STT)、检索增强生成(RAG)等功能,并利用零拷贝计算图和针对ARM架构优化的SIMD内核来实现高性能、低内存占用的模型部署。

4,552 338 4,552 22
在 GitHub 上查看
cactus-compute/cactus

技术栈

查看全部依赖 (9)

依赖

einops unknown huggingface_hub unknown num2words unknown pillow unknown sentencepiece unknown timm unknown torch unknown torchvision unknown transformers unknown

截图

assets/banner.jpg

评论

- 위키
Copyright © 2011-2026 iteam. Current version is 2.155.1. UTC+08:00, 2026-04-02 12:34
浙ICP备14020137号-1 $방문자$