类库
› cactus
cactus-compute/cactus
Cactus是一个针对移动设备和可穿戴设备的低延迟、高能效AI推理引擎。它提供OpenAI兼容的API接口,支持聊天、视觉、语音识别(STT)、检索增强生成(RAG)等功能,并利用零拷贝计算图和针对ARM架构优化的SIMD内核来实现高性能、低内存占用的模型部署。
标签
技术栈
查看全部依赖 (9)
依赖
einops
huggingface_hub
num2words
pillow
sentencepiece
timm
torch
torchvision
transformers
截图