类库 › MSA
EverMind-AI

EverMind-AI/MSA

MSA是一个可扩展的端到端可训练的稀疏注意力记忆框架,旨在突破LLM有效上下文长度限制,提供100M token级别的长上下文处理能力。它通过稀疏注意力、KV缓存压缩和内存交错等技术,在训练和推理中实现近线性复杂度,显著提升长文档问答等任务的性能。

2,537 145 2,537 5
在 GitHub 上查看
EverMind-AI/MSA

截图

Figure 1: Scaling curve 16K→100M tokens
Figure 2: MSA layer
Figure 3: Inference

评论

ホーム - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.1. UTC+08:00, 2026-04-06 07:04
浙ICP备14020137号-1 $お客様$