服务可达的数据链DNA

如果无法正常显示,请先停止浏览器的去广告插件。
分享至:
1.
2. IT运维监控全视图
3. 革命性的理念:服务可达 的新IT指标体系 95后 复杂 可用性 应用 客户端 Edge/CDN 云 /DC 门户 应用 代码 国产化 2020, 用户为中心 服务可达 90年代, 应用为中心 HA/负载均衡/N+M 全冗余链接/带外管理 99.999%/RTO/RPO 两地三中心 双活/多活/多云多活 API PaaS 微服务 性能,体验 70年代, 计算为中心 主机HA
4. 最终用户为中心的服务可达, 打通“云管边端”, 取代应用为中心的应用可用 企业客户的数字化转型, 必须改变原有的数据中心以应用为中心的传统思维, 其中最重要的就是“O视角”还是“C视角” 95后 体验第一 国产化 服务可达 应用 端 智能终端 边 边缘 /CDN 管 通道 / 链路 云 混合云 /DC 业 应用 / 代码 API PaaS 微服务 性能,体验 O视角: 企业自己的视角, 以应用为中心, 数据中心为基础, 应用高可用为指标 C视角: 用户端视角, 以服务可达为基础, 用户体验为指标, 互联网的用户第一原则 市场根源: 95后逐渐成为了消费市场的主力,从小生活条件优越的Z世代,有着巨大的消费潜力,他们更加渴望自 由而弹性的生活,特别是对在线服务的可用性和体验的要求极高, BATJ为体验参考, 否则携号转网, 携款转户。
5. 代码到用户的数据链DNA,全过程监控服务可达 95后 体验第一 国产化 服务可达 1.2% 性能,体验 10.3% 应用 API PaaS 微服务 DEM 用户数字化体验管理 NPM 网络性能管理 APM 应用性能管理 DEM (Digital Experience Management) : 用户数字体验管理, 包含客户端APP体验监控, 浏览器体验监控, 小程序体验监控, 浏览器拨测和手机真机拨测等一系列技术 NPM (Network Performance Management) : 网络性能管理, 通过探针技术、 BigIP大数据引擎、Nginx Telemetry等技术, 实现网络传输的路径发现, 异常发现, 故障发现。 APM (Application Performance Management) : 应用性能管理, 通过字节码注入和微服务探针, 无需应用代码变更的情况下实现对代码运行效率, SQL调用效率, PaaS API调用逻辑追踪, 以及微服务的性能监控
6. 业务全 全数据链探知路径, 径( + 应 ) 代码到用户 服务品质, Web 务器 代 2 代 代 互 均 代 墙 App 务器 APP服务, API服务 4 应 应 3 应 1 应 内 2 件层 3 1 内 及 协 4 及 协 件层 据库 交换 交换 交换 交换 交换
7. 博睿数据 7种武器提供完善数据链DNA技能 95后 复杂 可用性 应用 客户端 Edge/CDN 云 /DC 门户 应用 代码 国产化 API PaaS 微服务 性能,体验 1. 客户端: 拨测/SDK/反嵌JS 通过浏览器和手机真机APP拨测, 客户APP的SDK嵌码, Browser/H5/Webview监控, 确保服务可达并提升用户体验; 2. Edge/CDN节点: 主动拨测: 性能监控, 得到使用过程中的实际性能表现, 延迟和丢包 作为选型依据和性能排查依据。 3. 云服务: 月报/定制测评 通过每月对云服务商监控提供定期性能报告, 成为企业客户对多云服务的议价依据, 从而提升企业客户的实际服务能力和可用性 4. 门户: 页面/首屏加载分析 信创环境和传统环境的灰度性能分析; 提供专业建议, 来提高体验, 避免劫持, 从而提高可用性 5. 网络: NPM网络性能管理 实时流数据抓取分析技术, 实时流数据路径判断, 快速发现和排除网络上的节点故障, 6. PaaS平台/API: ADT 应用深度追踪 调用逻辑的自动拓扑可视化, 快速发现API服务异常, 重载过库攻击等现网环境风险; 7. 代码/DB: APM 应用性能管理 通过字节码注入, 无需开发变更, 现网实现对代码执行, SQL调用效率的监控, DevOps的必备技术, 也是提升信创平台应用性能的利器
8. 服务可达的信息整合和特征关联 业务洞察 用户数字化 体验管理 VIP 用户追踪 AIOps 自动化 智能运维 95后 博睿数据 机器学习 /AI 大数据平台 代码到用户全过程 流数据遥测 Telemetry 可用性 1.2% 性能,体验 10.3% 应用 国产化 D EM 用户数字化体验管理 N PM 网络性能管理 API PaaS 微服务 A PM 应用性能管理 取得了不同环节的体验数据, 网络数据和代码执行效率数据后, 需要通过DataView的大数据平台实现 信息整合, 和特征关联. 实现对VIP用户访问的访问过程全栈溯源, 提升用户体验; 同时实现机器学习后的 智能基线, 智能警报; 再通过AI人工智能实现根因分析, 提出解决建议和方法, 甚至通过API调用验证过的 预配置, 实现一键变更和一键割接。
9. 信息整合 》特征关联 》业务洞察 信息整合 特征关联 业务洞察 将用户体验数据, 网络 性能数据, 应用性能数 据, 应用可用性数据等 信息整合, 实现统一收 集, 统一存储, 统一管理, 通过API调用的方式实现 一次采集, 各部门的多 次订阅消费 通过大数据分析和用户标 识, 建立用户访问, 网络传 输, 云服务, API调用等各 环节的关联关系, 实现全 栈溯源, 真正帮助电子银 行业务, 在保证稳定可靠 的社会责任的同时, 融合 现有平台、云原生平台、 国产化平台、微服务平台 的监控管理手段 用财务语言汇报数据中 心的投入产出, 建立带 宽、算力、存储等基础 设施投资后, 发现具体 的用户体验/用户留存 率/月活提升、 API调用 效率提升、以及代码运 行效率提升之间的关联 关系. 通过大数据平台打通“云-管-边-端”, 并通过机器学习和人工智能实现“信息整合,特征关联和业务洞察”, 帮助企业在国产化大环境下应对Z世代对服务可达, 应用体验的高要求,提升IT运维效率和自动化能力
10. 构建从代码到用户的性能管理体系
11. 场景1: 用户为中心的自动化业务流程验证 金融客户系统配置变更, 灰度版本发布 到 全 产品 Bonree Browser IPv6监测场景 Bonree ITIM 3rd parties Web WEB门户类IPv6对比监测 手机APP类IPv6对比监测 动 务器 Bonree App Bonree Reesii 务器 WEB 务器 主动 Bonree Net 减少50%配置 变更,版本升级 的人为错误 Bonree Server Bonree MobileSDK 务 短信监测 Bonree LoadTest 压力 基于博睿数据NET的WAP会员能力,提 • 任务名称 域名 门户网站系统(IPV6) www.xxbank.com 门户网站系统(IPV4) www.xxbank.com 到 诸多供应商如何选型 供遍布全国各省市的 动发 • 已有供应商质量如何监控 平均TCP用时(s) 连接成功率(次) • • 0.034 99.5% 短信信道被封禁或不稳定如何提前感知 0.048 可 性能时延等实时数据监控能力。 99.6% 如何评估短信是否到达或及时到达 因 业务关 化 稳定在线的 发 创smart trace ,与 DEM 关 , 一 台使 , 做到 到 , 创 , , 助复 真机短信监测节点,提供短信到达率、 可 化 可用性监测 和 MTTR 帮助用户 短信服务 通过对中国xx银行主要互联网应用的日常监测(官网、电子银行、善融商务、x x云、x x大学等), 质量,助力短信服务问题的解决方式从 主动发现问题,保障了各类用户的正常使用体验,确保了电子渠道相关业务的正常运行: 被动通知向主动感知转变。 3.54 亿户 143 亿元 xx电子银行 用户数 xx电子银行收入 (2020年上半年) 75.7 亿元 及分 , 响 基 代 , 关 ,减少 业务过程监测 7000 万 通过用户登陆,模拟真实用户操作,快速定位具体如查询、转账、购买等真实业务场景的可用性及性能问题, 善融商务平台扶贫交易 xx电子银行 实现故障的全面监控与定位。同时,平台具备底层代码的性能抓取能力,可针对特定方法进行性能数据采集,实现对 MAU(月活用户数) 特定业务如:查询、转账、购买等行为的性能数据采集与分析。支持手机APP和PC。 通过主动监测,自动发现问题,改变了出现故障依赖用户上报投诉, 100% 被动响应的模式。通过博睿数据互联网监测平台,被监控页面访问故障的 80% 主动发现百分比由原有不足10%提升至了90%。 60% 故障主动发现能力提升 90% 40% 20% 10% 0% 使用前 使用后
12. 场景2: 用户为中心的服务可达指标体系 证券客户行情评比及专家优化建议 构建评分体系,以统一标准管理应用系统,使管理者可以高效的 确定性能优化的重点;同时让多个部门有了沟通问题的的数据桥 梁,不再各自为战,做到步调一致力量一致,高效排障。
13. 场景3: VIP用户会话全栈溯源, 微服务环境 电商客服中心的新业务流程 自动梳理访问关系,形成应用、服务、业务 拓扑,实现应用间复杂关系的可视化。客服 中心/运维中心可以通过服务和业务的视角 ,快速提取客户投诉的关键业务调用关系, 并从根源上快速找到根本原因, 形成配置变 更建议, 快速提升VIP用户体验.
14. 总结 深挖应用场景, 运用海量多维数据实现信息整合、特征关联和业务洞察 通过数据链DNA 实现应用可用到服务可达的过度, 建立以用户为中心的服务可达能力的监控和评估体系, 提升自动化运维能力, 提升95后新生代的用户体验, 加快数字化转型.
15. 博睿数据用户体验管理(DEM)方案 用户体验监控分为无侵入式的模拟监测和代码注入式的真实用户体验监测
16. 主动式监测能力(NET/APP) l 竞品分析 通过对横向对比用户体验数据,掌握同行业竞争对手的业务体验数据 ,了解当前产品在行业竞争中的优劣势; l 私有协议(PC/移动端口) 对客户独有协议或端口进行监测,有针对性的记录 l 基础网络(PC/移动网络) 数据交互中稳定性和安全性的现状; 针对应用的基础链路,DNS解析,ICMP时延 和丢包状况,以及路由情况进行监控。 l Web/Wap浏览分析与优化 l IPv6监测 和页面结构层进行分析; 实时获取网站的性能数据,分别从网络层、应用层 通过使用IPv6监测点相关资源,访问IPv6站 点,实时掌握IPv6站点的可用性及性能,对 相关问题及时优化调整,确保IPv6网站建设 符合银监会的建设要求 l 劫持/篡改监测 通过任务定制,实现对DNS解析地址的黑白 名单配置、页面元素审查配置、页面下载大 小、页面元素个数等内容进行监测,主动发 现劫持篡改现象,并进行实时告警 l 文件传输(CDN监测) 通过文件上传/下载来透视网络资源品质,真实反映带宽的波动性, 了解CDN及网络带宽情况; l 事务流程 记录用户真实交互行为,包括用户登录、注册、留言、在线交易、搜 索引擎等还原流程现状了解真正的瓶颈点;
17. 真实用户体验监测(Browser/SDK/MP) 通过SDK或Js注入,即可全面掌握其用户的感知和行为数据的前端应用管理产品。不仅可以帮助客户及时发现并定位网页/APP/小程序上线 后存在的应用性能及崩溃(ANR)、卡顿、网络错误和H5页面的JS错误的问题原因,还可以真实反映用户的留存与操作情况,帮助开发者对 APP进行优化,提高用户粘度。
18. Bonree Reesii NPMD平台 大屏展示 数据分析 配置 事件关联 网络流量 告警中心 Logs日志 人工智能 自动报告 API NoCode CMDB IDC数据中心 或 VPC云网络
19. 覆盖混合架构的网络大数据平台 分支机构 公有云 Bonree Reesii 云探针 元数据 物理探针 VM 数据采集分析探针 VM TAP 拨测 北区 网络流量 日志 CMDB 配置 API ebpf VM 私有云 传统 IDC VM 南区 vSwitch vSwitch Netflow VM VM1 VM2 宿主机 VM1 VM2 宿主机 VM 海外 Reesii 平台特点 旁路部署 分布式部署 多云部署 不影响网络及业务 横向扩容,满足需求 私有云、公有云、多分支 全链路关联
20. 日益复杂的IT系统 Web入口 APP应用 DB数据库 三层架构 高可用架构 应用多活架构 微服务架构
21. 博睿数据APM应用性能监测平台 Bonree 应用性能分析平台 大屏展示 数据分析 事件关联 告警中心 人工智能 管家服务 Observability 可观测性 真实用户访问数据 Tracing调用链 Metrics指标 Logs日志 MobileSDK 小程序MP Browser Bonree Server IDC数据中心 或 VPC云网络
22. 可观测性之数据采集全面 覆盖广 业务 用户 全数据链路数 据 Tag数据 服务 web服务 进程 容器 事件记录数 据 2000+指标 事务交易 主机 微服务 SQL数据库 NOSQL数据库 消息队列
23.
24. 可观测性之Ser verless监控
25. 微服务中的部署 =Docker 用户访问 自动发现,自动安装,自动监控 时间 8:00 12:00 20:00 2:00 SmartAgent技术 支持容器/微服务/云化/虚拟化等各类场景,对后续技术路线科可完美适配,可实现被监控应用的自动发现、 自动安装与自动监控
26. 智能评分 异常检测 智能评分 阈值检测 99 78 综合评分 89 周期异常检测 43 16 多指标、多维度智能评分 学习和预测 按权重综合评分 模型检测
27. 四步实现代码级故障诊断 2 1 4 3
28. 故障的便捷诊断 宏观呈现APP质量,判断问题归属 最慢方法、查看最慢DB、最慢NoSQL、最慢远程调用、错误
29. 丰富的产品功能 自动化全方法追踪 Server 产品能力 Ø 业务拓扑分析 Ø 报警管理 Ø 错误分析 Ø 应用拓扑分析 Ø 应用主机分析 Ø NoSQL分析 Ø 大屏展现 Ø 数据库分析 Ø 调用链分析 Ø 线程剖析 Ø 快照分析 Ø 基础设施监控 Ø 业务分析 Ø 远程调用分析 Ø 连接池监控 应用一览监控 完整详细且层级清晰的拓扑展现能力 基础架构蜂窝监控
30. 客户痛点/业务挑战 线上 挑战 线下开户 线下 VTM一站式系统 用户体验 维度:方面缺乏用户视角 故障定位 故障解决手段单一,定位难 竞业分析 不具备同行业横评能力 个人业务 账号管理 机构业务 投资理财 协同咨询
31. 业务价值 通过对某客户主要互联网应用及企业内部系统的日常监测,主动发现问题,保障了各类用户的正常使用体验,确保了 电子渠道相关业务的正常运行: • 通过构建DEM监控的平台,增加了用户视角的监控数据,提升了客户17.9%的监控覆盖率 • 通过SERVER监控,结合DEM实现了端到端数据的联通,快速/准确的问题定位 • 通过Beta版本APP的STOCK测评,预先感知版本上线后的性能情况 上线前 实现了 排查效率提升 7天 0-1 的监控架构 50% 即可完成性能感知评测,避免了 上线后产品问题导致的品牌损失
32. 业务价值 • 通过构建DEM监控的平台,增加了用户视角的监控数据,提升了客户17.9%的监控覆盖率 • 通过SERVER监控,结合DEM实现了端到端数据的联通,快速/准确的问题定位 • 通过Beta版本APP的STOCK测评,预先感知版本上线后的性能情况 上线前 实现了 排查效率提升 7天 0-1 的监控架构 50% 即可完成性能感知评测,避免了 上线后产品问题导致的品牌损失

Home - Wiki
Copyright © 2011-2024 iteam. Current version is 2.137.1. UTC+08:00, 2024-11-15 13:02
浙ICP备14020137号-1 $Map of visitor$