智能化压测-应用稳定性基石
如果无法正常显示,请先停止浏览器的去广告插件。
1. 智能化压测-应用稳定性基石
杨晓芬(倚梦)
阿里云智能技术专家
2. 01 稳定性挑战
Contents
目录
02 智能化压测
03 未来展望
3. TimeOut
业务受损
4. 教训
2009年,交易和商品系统挂了,很多商家的外部图片空间压挂了
服务器容量,网络带宽容量,系统保护都是没有的 200
9
2010年,零点峰值出现了大量的购买失败,但是服务器没有大面积宕机 201
0
2011年,临时通知所有有问题的商家下架商品
沟通会,商家对双十一的最大期望:系统稳定
2012年,系统超卖问题,0点系统显示交易成功率不到50%,各种系统报错
201
1
201
2
系
统
不
稳
定
5. 传统备容
入口流量 预估量级
购物车 应用
详情
数据库
消息中间件
下单
缓存
单机预估 大促态
单系统业
务峰值 扩容&缩容
单机压测
峰值 设置限流
6. 单集群ready并不代表全局ready
7. 智能化压测
New Future on Cloud
02
8. 平台化覆盖阿里各种业务生态的全/单链路 大促保障的核武器
10000+ 400+
9. PTS 特点
确定性
一样的业务
模型
CRM
一样的业务量级
一样的业务场景
一样的用户规模
一样的流量
来源
一样的线上
环境
10. PTS 解决方案
OPENAPI
一样的环境
压测流量
一样的业务模型
压测数据 压测场景
数据调度 任务调度
压测执行
安全防护层
控制
中心
过程监控
引擎调度
性能分析 压测报告
数据与任务分发
流量入口层 流量入口层
后端应用层 后端应用层
中间件层 中间件层
存储层 存储层
PTS
一线城市
压测引擎
一样的流量来源
业务
二线城市
压测引擎
三四线城市
压测引擎
全球各地
压测引擎
全国各地CND节点
真实贴近用户行为
正式流量
云监控/ARMS
自有
监控
11. PTS 解决方案
1
Web服务器
正常
流量
压测
流量
应用
Logs
filter
中间件
存
储
过
滤
器
缓
存
过
滤
器
正常表
2
压测可识别
压测流量识别之后的传递
影子表
3 应用系统识别和兼容压测流量
4 缓存和存储将压测数据存储到
影子区域(表)
正常
区域
影子
区域
12. 智能化压测
压测前 压测中 压测后
业务模型构造 智能压测 根因定位
灵活 架构识别 一键式定位
低成本 压力模型探测 专家建议
13. 智能化压测
360监控
录制器
模型
构造
场景编辑
数据工厂
智能探测
Timing瀑布流
在线调试
容量水位
应用层监控
根因分析
系统层监控
压测
模式
智能压测
API Monitor
安全层监控
定时压测
AHAS
限流降级
问题自动修复
流量漏斗监控
Jmeter
容量规划
流量
定制
CDN
联通
运营商
移动
运营商
阿里云VPC
阿里云内网
专有云
电信
运营商
业
务
架
构
识
别
安
全
防
护
层
流
量
入
口
层
后
端
应
用
层
中
间
件
层
存
储
层
弹性伸缩
专家建议
14. 智能化压测
架构自动识别
架构识别
安全层/网络层/应用层/存储层
压力模型探测
稳定值
极限值
破坏值
问题根因定位
性能瓶颈根因探测
问题自动修复
15. 应用场景
金融/保险
太
太
太
芒果TV
中国
太平
广发
银行
中国
平安
其他
汇付
天下
中国
人寿
太平
茅台
保险
联通
汽车
之家
CCTV
懂球帝
太平
趣头条
保险
逻辑
思维
太平
优酷
保险
蜻蜓FM
16. 未来可期
数据模型
智能构造
用户使用路径
线上日志
UI-object技术
压测过程
全链路数据
智能压测
压测结果
全链路监控
智能分析
自动调速 容量建议
自动停止 问题修复
自动探测峰值 专家建议
一键启动,自动修复
无人值守压测(PTS)
17. THANK YOU!
18. 高可用架构专场
Session on High Availability Architecture
19. 高可用架构专场
Session on High Availability Architecture
20. 高可用架构专场
Session on High Availability Architecture