TRAE Cue 时延优化:1.2s 至 500ms 突破
如果无法正常显示,请先停止浏览器的去广告插件。
1. TRAE
(Meet>p)
TRAE Cue 时延优化:1.2s
500ms 突破
炳洲
trae.ai
2. TRAE
(Meet>p)
01 02
重新认识CUE 挑战与
标
03 04
性能攻坚 未来与展望
trae.ai
3. 重新认识CUE
Cloud functions are part of the serverless architecture paradigm,
which allows developers to build and run applications and services
without having to manage infrastructure.
01
4. 01
Cue的演进
Cue(Context UnderStanding Engine) 是 Trae 提供的智
能编程 具, 持代码补全、多
导 和智能重命名等功能。
修改、编辑位置预测、智能
5. 典型场景介绍
02
1 2 3
代码补全 多点编辑 智能改写
基于 基于 结合上下
4 5 6
智能导 智能重命名
智能识别并导 智能识别并改写实体重命名
跨
件跳转
智能跳转
6. 典型场景介绍
02
智能改写
智能导 智能重命名
代码补全
7. 02
件跳转
跨
件跳转
8. 过往
程碑
TRAE Cue 从代码补全出发,进
2024.6 2024.9 2025.6 2025.10
MarsCode 国内正式发布 多点编辑功能上线 Cue 1.0上线 Cue 1.2
融合代码续写与编辑为单个模型 引
基于
9. 挑战与
标
Cloud functions are part of the serverless architecture paradigm,
which allows developers to build and run applications and services
without having to manage infrastructure.
02
10. 竞品时延
Cursor
Cursor CN 580ms
Cursor US 300ms
Windsurf
Windsurf CN 770ms
Trae
Trae CN 1.2s
11. 响应延迟问题
1.2s 痛点:交互卡
顿与 智流失
为了提升 户体验,Cue 设定了将延迟优化
300ms 的 标,这不仅是技术挑战,更是 户
体验的 存线。
12. 性能攻坚
Cloud functions are part of the serverless architecture paradigm,
which allows developers to build and run applications and services
without having to manage infrastructure.
03
13. CUE请求链路
14. 客户端提速
Hot Streak 机制
引
15. 络时延优化
络定制化优化
基于线上
16. 服务端加速
PE 构建优化
通过 tokenizer 级复
异步中间件优化
将权限、审计、埋点等中间件
全异步化,请求实际进
Gateway Rust 化
把 Python gateway 重写成
Rust,在
17. 模型推理攻坚
模型升级
LLM模型从MHA结构升级到
GQA结构
模型量化
W4A16 + W8W8混合精度量化
18. 模型推理攻坚
kv缓存优化
负载均衡策略升级
投机采样策略
system prompt cache优化 LB 策略从 weighted random 结合 ngram speculative
20ms。未来将会持续做user级 升级为 dynamic weighted sampling 与 spec_k 调优,单
random,实时按机型与队列 请求解码输出 5.2 token,解码
别的prompt cache优化
次数减少 80%
19. 模型推理攻坚
络库
nd-draft 优化
reject-sample
将
reject-sample 优化
20. 策略优化
络库
上下
通过动态收缩重写窗
改写
21. 优化结论
22. 竞品时延
Cursor
Cursor CN 580ms
Cursor US 300ms
Windsurf
Windsurf CN 770ms
Trae
Trae CN 500ms
23. 未来展望
Cloud functions are part of the serverless architecture paradigm,
which allows developers to build and run applications and services
without having to manage infrastructure.
04
24. TRAE
(Meet>p)
The Real AI Engineer.