亿级金融系统智能运维的深度实践
如果无法正常显示,请先停止浏览器的去广告插件。
1. 亿级金融系统智能运维的深度实践
演讲人:陈泽昊
全球敏捷运维峰会 广州站
2. 目录
➢ 微众银行分布式架构
➢ 自动化之路
➢ 智能化实践
➢ 挑战及未来
全球敏捷运维峰会 广州站
3. 目录
➢ 微众银行分布式架构
全球敏捷运维峰会 广州站
4. 微众银行分布式架构
全球敏捷运维峰会 广州站
5. 目录
➢ 自动化之路
全球敏捷运维峰会 广州站
6. 自动化之路
• 最大的挑战:
• 业务增长量超过人力增长
• 多业务场景,业务架构差异
• 需求迭代频繁、快速
• 审计
全球敏捷运维峰会 广州站
7. 自动化之路
• 微众银行的策略
• 流程化 + 标准化的建立
• 工具全链路打通
• 运维数据可视化
全球敏捷运维峰会 广州站
8. 自动化之路
• 自动化:
•
及时性
•
•
准确率
•
•
金融系统对稳定性的要求
多业务场景带来不确定因素
规模带来的挑战
全球敏捷运维峰会 广州站
9. 目录
➢ 智能化之路
全球敏捷运维峰会 广州站
10. 智能化之路
• 智能化前提
• 数据
• 自动化
全球敏捷运维峰会 广州站
11. 智能化实践
• 资源管理
• 建立数据生命周期管理
• 自动化流程驱动数据更新
• 运维工具对接,提高数据流动性
• CMDB + IMS + WCS/WeCloud
• 基于智能应用画像进行调度
• 动态扩缩容
应用属性
开发语言、所属部门、
业务线
运维属性
版本号、自动扩缩容、
防火墙策略
全球敏捷运维峰会 广州站
应 用
像 画
监控数据
CPU、Mem、
Network、IO
依赖关系
上下游系统、Redis、
数据库、WEMQ
12. 智能化实践
• 监控 - 异常检测
•
指标异常检测
• 原则:少见即异常
• “慧识图”核心算法
• 基于 LSTM 与高斯分布
• 基于 k-means 算法
• 基于概率密度
• 主动异常预测
• 滑动窗口 – 低频交易
全球敏捷运维峰会 广州站
13. 智能化实践
• 监控 - 根因分析
•
知识图谱
• 数据多维度采集
• 根因定位
•
•
基于“交易树”
事件指纹库 + 人工标记
全球敏捷运维峰会 广州站
14. 智能化实践
• 变更领域
•
•
质量
• 建立SOP
• 准生产环境验证
效率
• 自动化发布
• 自动化验证
无人值守率 整体效率提升
55% 30%
全球敏捷运维峰会 广州站
15. 智能化实践
• 规模领域
•
•
•
扩容速度
效率
一键扩容DCN
质量
•
1
工作日
应用数据一致性
全球敏捷运维峰会 广州站
单日金融交易峰值
7.98
亿笔
16. 智能化实践
规模 一键扩容DCN 数据一致性 变更 建立SOP 准生产验证 应用画像
监控 异常检测 滑动窗口 根因定位
资源 数据生命周期 运维工具对接 应用画像
全球敏捷运维峰会 广州站
自动验证
动态扩缩容
17. 目录
➢ 未来及挑战
全球敏捷运维峰会 广州站
18. 未来及挑战
• 智能化:
•
提升准确性和有效性
• 无人化
• 提升无人值守的覆盖度
• 进一步提高运维各领域的效率、降低IT成本
全球敏捷运维峰会 广州站
19. THANK YOU!
全球敏捷运维峰会 广州站