中间件与数据库:Tair

Tair 短期记忆架构实践:淘宝闪购 AI Agent 的秒级响应记忆系统

淘宝闪购AI Agent通过Tair实现秒级响应记忆系统,支持自然语言点单流程。Tair提供低延迟、丰富数据结构和弹性扩展能力,确保Agent在多轮对话中准确记忆上下文。利用List和Hash结构分别存储对话历史和业务上下文,通过分布式锁保障并发安全,弹性扩缩容应对流量高峰,TTL自动清理过期数据,确保系统稳定高效。

阿里云Tair KVCache仿真分析:高精度的计算和缓存模拟设计与实现

KVCache在大模型推理中逐渐升级为系统级基础设施,面临高维配置空间的优化挑战。阿里云推出Tair-KVCache-HiSim,首个分布式多级KVCache管理仿真工具,通过全链路建模实现高精度性能预测,支持计算选型、存储规划与调度策略协同优化,显著降低推理性能评估成本,助力智能化推理系统设计与部署。

阿里云Tair KVCache Manager:企业级全局 KVCache 管理服务的架构设计与实现

阿里云即将开源企业级全局KVCache管理服务Tair KVCache Manager,专为Agentic AI设计。该服务通过高性能网络解耦算力与存储,支持PB级KVCache池化,具备动态伸缩、多租户隔离等能力,兼容主流推理引擎。架构上采用中心化元数据管理,抽象LLM语义接口,并集成多种存储后端,显著提升大模型推理性能与资源利用率。

Hybrid Model Support:阿里云 Tair 联合 SGLang对 Mamba-Transformer 等混合架构模型的支持方案

阿里云Tair KVCache团队与SGLang社区合作,针对大模型推理中的显存与计算瓶颈,提出了混合架构模型支持方案。通过双内存池设计、状态快照技术及推测解码适配,解决了Transformer与Mamba模型的内存管理冲突,显著提升了推理效率。实测Qwen3-Next等混合模型在SGLang上表现出色,为大规模推理提供了高效、可靠的技术支持。

阿里云 Tair 基于 3FS 工程化落地 KVCache:企业级部署、高可用运维与性能调优实践

阿里云Tair KVCache团队与服务器研发团队联手升级3FS分布式文件系统,针对AI大模型推理场景优化性能、稳定性和云原生管理。通过RDMA流量均衡、全用户态引擎等提升4K随机读性能150%,解决IP漂移等关键问题,并基于K8s Operator实现一键部署和故障自愈。集成SGLang/vLLM后,长上下文推理吞吐提升520%,冷启动加速效果显著。未来将持续深化软硬协同,打造端到端KVCache解决方案。

阿里云 Tair 联手 SGLang 共建 HiCache,构建面向“智能体式推理”的缓存新范式

大型语言模型推理中,KVCache机制通过缓存历史Key-Value对提升效率,但在智能体推理场景下面临状态膨胀、跨轮次持久化缺失和多任务缓存孤立等挑战。阿里云Tair KVCache团队与合作伙伴构建了多级KVCache Offloading和全局共享方案,显著提升了缓存命中率和推理性能。SGLang HiCache技术通过分层缓存管理,突破了显存容量限制,实现了高效的KVCache卸载与预取,为长上下文和高并发推理提供了坚实基础。

阿里云Tair KVCache:打造以缓存为中心的大模型Token超级工厂

Tair KVCache是阿里云为应对大语言模型推理中的显存瓶颈推出的创新缓存加速服务。通过构建显存-内存-存储三级缓存体系,动态分层存储KVCache,显著提升计算效率和上下文长度支持。其分布式内存池化设计突破了单机内存限制,支持更大批处理和长上下文推理,同时优化带宽利用率,实现高效推理加速。Tair KVCache兼容主流推理引擎,提供毫秒级响应,满足高并发、低延迟的生成式AI场景需求。

为什么要用 Tair 来服务低延时场景 - 从购物车升级说起

本文围绕 Tair 低延时这一本质特征在构建时所采用的系统手段,藉此提出更多问题来探讨,进一步打造更强大的内存数据库。

Tair 对 Redis 引擎架构之争的看法

云原生内存数据库 Tair 是阿里云自研数据库,兼容 Redis 的同时提供更多数据结构和企业级能力,包括全球多活、任意时间点恢复和透明加密等。

HotRing: 阿里缓存系统Tair的自感知热点数据子组件

阿里双十一核心中间件Tair的一个牛逼哄哄的子组件HotRing是如何提升性能的!

阿里巴巴分布式缓存服务Tair的热点数据散列机制

Tair 是阿里巴巴集团自研的弹性缓存 / 存储平台,在内部有着大量的部署和使用。

  • «
  • 1
  • »

Главная - Вики-сайт
Copyright © 2011-2026 iteam. Current version is 2.155.0. UTC+08:00, 2026-03-28 11:50
浙ICP备14020137号-1 $Гость$