中间件演进和稳定性治理实践
如果无法正常显示,请先停止浏览器的去广告插件。
1. 中间件演进和稳定性治理实践
前 哈啰出行高级技术专家 / 梁勇
2.
3. 个人介绍
梁勇,《RocketMQ实战》作者、《RocketMQ技术内幕》审稿人、
QCon研习社讲师、极客时间训练营中间件专题讲师。深耕中间件领域多年,从
事中间件相关的开发和治理工作。在公众号「瓜农老梁」持续发表中间件相关文
章,涵盖开源中间件的源码分析、实战笔记、性能优化、方案设计等。
梁勇(老梁)
4. 目录
一、中间件演进规范实践
二、中间件变更规范实践
三、中间件异地双活实践
四、稳定性治理内容提点
5. PART
01
中间件演进规范实践
6. 背景介绍
中间件未来规划是什么?
• 中间件有几十个组件该从哪个组件说起?
• 中短期中长期都有所不同,该说近的还是远的?
• 散落文档和零散的想法,去回答这些问题的时候能否说的全?
7. 中间件演进规范
通过对中间件功能、架构以及关键能力的定期聚焦,暴露中间件
存在的问题和风险,把控未来演进方向,呈现中间件现状和未来演进的
清晰画像。
8. 演进规范内容
9. 消息演进示例(一)
一、功能描述
二、架构能力
10. 消息演进示例(二)
三、关键能力
四、问题暴露
11. 消息演进示例(三)
五、未来演进
六、实施里程碑
12. 演进规范总结
每个中间件从功能、架构、关键能力入手,根据公司战略,延伸
到业务赋能、降本提效、用户体验等方向,通过定期聚焦,确保演进规
范能指导中间件未来演进。
13. PART
02
中间件变更规范实践
14. 背景介绍
中间件最近为什么故障这么多?
• 当被人这么问的时候总有点尴尬,该如何解释呢?
• 说团队成员疏忽了?还是测试同学没测到位呢?
• 有什么措施让问题暴露在滞留期、小范围、低等级服务?对业务影响降到最小?
15. 中间件变更规范
通过对中间件分类分级梳理,制定不同的变更规范,让风险暴露
在停留期、小范围、低等级服务,保障中间件的平稳运行,降低对业务
的影响。
16. 变更规范内容
17. 变更规范示例(一)
18. 变更规范示例(二)
19. 变更规范总结
通过对每个等级的中间件制定变更规范,贯穿需求到上线整个流
程,使得潜在风险得以充分暴露,暴露在停留期、小范围、低等级服务。
20. PART
03
中间件异地双活实践
21. 背景介绍
中间件在异地双活中需要做哪些事情?
• 为什么越来越多的公司将异地双活作为战略项目来推动?
• 在推动异地双活改造中的有哪些注意事项?
• 各个中间件在异地双活的方案该如何设计?
22. 异地双活原因
双活原因
23. 异地双活注意事项
注意事项
推动事项
24. 异地双活方案初衷
25. 请求流量机房分配
26. 路由因子选择与映射
路由因子
机房映射
27. 多活规则管控中心
28. 注册中心双活方案
29. RPC框架双活方案
跨机房调用
注意事项
30. 消息双活方案
跨机房复制
流量隔离
31. Redis双活方案
双向复制
功能与建议
32. MySQL双活支持
双向复制
功能与建议
33. 双活其他事项
其他改造事项
34. 双活流量切换过程
35. 异地双活总结
回顾了异地双活实践中各个中间件的设计方案、实现原理和注意
事项,供在落地实践中参考。
36. PART
04
稳定性治理内容提点
37. 内容提点(一)
38. 内容提点(二)
39.
40.