Kubernetes多集群环境下数据组件的高可用
如果无法正常显示,请先停止浏览器的去广告插件。
1. Kubernetes多集群环境下
数据组件的高可用
徐昕
Data Infrastructure
2. 目录 CONTENT
背景&挑战 03 状态管理
02 云原生架构 04 容错恢复
01
3. 01
背景与挑战
4. 数据组件
5. Kubernetes管理数据组件
无状态应用
状态
❖
❖
❖
❖
❖
分布式一致性
数据持久化
I/O性能
容错
备份和恢复
流量
❖
❖
❖
负载均衡
限流
降级
有状态应用
6. Kubernetes多集群下管理数据组件
容错分布
跨数据中心/集群/机架
资源管理
物理机资源优化
服务发现
全局域名
基础设施变动
集群升级更新下架
无感
7. 02
云原生架构
8. 云原生架构
应用特点
全量数据
主从模式
延迟不敏感
9. 云原生架构
● FederatedStatefulSet
功能
StatefulSet
FSS
跨集群管理 ✅
原地升级 ✅
灰度发布 ✅
发布顺序 ✅
生命周期定制 Pod
PreStart/PostStart ✅
应用保护机制 单集群 ✅
无缝迁移
✅
10. 云原生架构
应用特点
数据分片
难点
如何分布数据
11. 云原生架构
解决方案
●
●
●
容器调度
细粒度分组
数据反亲和
12. 云原生架构
应用特点
数据分片
多组件
难点
如何管理依赖关系
13. 云原生架构
应用特点
数据分片
多组件
延迟敏感
14. 云原生架构
云原生数据组件管理平台
标准化应用建模
数据分析
数据处理
消息队列
数据库
存储
●
●
●
跨集群管理
统一部署
自动运维
资源调配
故障演练
标准化云原生接口
安全合规
●
●
基础设施层
多组件依赖
HA模式
Sharding模式
状态驱动
多租户隔离
15. 03
状态管理
16. 状态转换
Controller
Controller模式
全局协作状态转换
可插拔生命周期定制
SideCar模式
自主选举
状态监控
闭环自愈
17. 应用保护
Pod中断预算保护pod disruption budgets
VS
应用中断预算保护 application disruption budgets
跨集群保护
控制范围
18. 04
容错恢复
19. 故障转移
监测服务异常
DC1 Endpoint
客户端/代理层无缝迁移
同步数据与校验
DNS Cache
DataCenter1
DataCenter2
DC2 Endpoint
20. 备份恢复
数据可靠性
执行点故障转移
数据同步状态检查
●
●
可观测性
●
●
●
执行引擎状态
备份历史记录
执行失败信息
可定制
●
●
备份策略
数据过滤
21. 混沌测试
故障模拟
模拟容器故障
模拟依赖组件故障
模拟基础设施故障
控制爆炸半径
数据中心/Kubernetes集群/机架物理机/容器
流程编排
标准流程
定制顺序
沉淀案例
22. 非常感谢您的观看