类库
› EchoStream
Kyle-Riss/EchoStream
EchoStream是基于Emformer的高效实时语音到语音翻译模型。通过缓存机制和CT-Transformer,实现低延迟、高吞吐量的流式处理,显著降低计算复杂度和内存占用,适用于需要快速、准确跨语言语音交互的场景。
技术栈
根目录 python
框架
FastAPI
查看全部依赖 (15)
依赖
NumPy
PyYAML
librosa
matplotlib
scikit-learn
scipy
seaborn
sentencepiece
sounddevice
soundfile
torch
torchaudio
tqdm
uvicorn
websockets