智驱流量,效赢增长——拨测&融合流量管理业务赋能实践

如果无法正常显示,请先停止浏览器的去广告插件。
分享至:
1. 智驱流量,效赢增长—拨测&融合流量管理业务赋能实践 莫瀚 vivo互联网拨测监控负责人 周建华 vivo互联网运维平台研发负责人
2. 目录 Part 01 第一部分|全球拨测监控 Part 02 第二部分|融合流量管理 CONTENTS
3. 第一部分|全球拨测监控 1.1 什么是拨测? 1.2 vivo拨测现状 1.3 vivo拨测具备的能力 1.4 拨测如何支撑流量调度
4. 什么是拨测? 拨测是一种模拟真实用户的行为或网络访问路径,执行健康检查和性能测量的旁路监控系统 性能监控 产品优化 可用性监控 拨测技术可以模拟用户访问网络的行为,检测 拨测技术可用于对多个产品进行性能对比分析, 通过拨测技术,可以模拟用户办理各类业务的 网络的连通性、时延、丢包等指标,帮助运维 从用户角度出发,评估各产品的优劣,为产品 流程,检测业务的可用性、响应时间等关键指 人员及时发现网络故障和性能瓶颈 改进和市场策略提供数据支持 标,从而评估业务质量并优化业务流程
5. vivo拨测平台介绍 主要职责:承接业务可用性监控需求,为业务提供高可用监测服务 网络性能监控 拨测模拟用户访问网络的行为,检测网络的连通性、 时延、丢包等指标,帮助运维人员及时发现网络故 障和性能瓶颈 业务可用性监控 模拟用户办理各类业务的流程,检测业务的可用性、 响应时间等关键指标,从而评估业务质量并优化业 务流程 产品优化分析 对产品进行性能对比分析,从用户角度出发,评估 产品优劣,为产品改进和市场策略提供数据支持 网络调度检测 针对CDN网络,机房网络,运营商等基础链路发起 探测,及时发现链路问题,通过拨测结果动态调整 网络链路和策略
6. vivo拨测自有手机节点规模 国内-覆盖国内所有城市、县级市(自有手机) 10万*N 330+ 5+ 国内手机数量 覆盖地级市 覆盖运营商 单日可承载拨测量 6亿+次/天 海外-覆盖主流国家和地区(自有手机) 海外手机数量(万台) 印尼 印度 越南马来 其他
7. vivo拨测系统原理图 探测地址(如HTTP://xxx) 访问异常,不可用,封禁 … 1、下发执行探测任务 拨测技术通过模拟真实用户的行为,对网络或业务进行主 动探测 任务下发服务 结果回收服务 2、数据采集与分析 在模拟用户行为的过程中,拨测技术会收集相关的性能数 据,如响应时间、丢包率等,并进行实时分析,为故障排 查和性能优化提供依据 边缘探测Agent 3、阈值和可用性告警 用户可以设定各项性能指标的阈值,当拨测结果超出阈值 时,系统会触发告警,以及时通知管理人员
8. 拨测能力介绍 任务执行 DNS检测 劫持 采集侧能力侧 链路性能检测 解析 配置调度 TCP建联 SSL握手 用户体验检测 CDN HTTPS 可用性检测 请求 响应性能 任务调度模块 任务请求 任务管理 网页首屏/ 首等能 Web检测 QUIC 私有协议 TCP 私有协议 流媒体等 策略控制模块 任务执行 IO/ 数据上报 HTTPS 私有多协议 本地存储 耗电管理 执行策略管理 远程配置管控
9. 拨测能力介绍 平台能力侧 WEB报表管理 任务下发能力 任务管理 即时拨测 拨测节点管理 周期探测 省份 运营商 配置管控 节点组管理 多维度下发管理 任务统计 任务配置 … 任务分片 报表展现 告警能力 告警管理 手机状态 策略控制 指标查询 指标查询 劫持告警 CDN告警 可用性告警 … 配置管理能力 配置管理 故障分析能力 禁用启用管理 紧急关停 版本管理 快照 拨测日志 链路 … 采集策略下发
10. 拨测是如何支撑融合流量管理进行智能流量调度的 输入 IP元数据管理平台 执行 IP信息 IP可用性指标 数据 流量智能调度 基于IP指标智能调度数据 故障快速恢复 故障精准定位 IP任务关键信息 IP任务 统一网关 IP结果关键指标 流量异常检测 流量智能调度 IP信息 Ip-icmpping 可用性 …… 归属运营 任务调度 结果回收 Ip-tcpping 可用性 归属业务 Ip-icmpping 延时 归属机房 Ip-tcpping 延时 归属集群 归属IDC 边缘探测Agent(真实手机+IDC)
11. 第二部分|融合流量管理 2.1 技术背景 2.2 平台实践 2.3 总结展望
12. vivo互联网流量接入现状 vivo采用自建与公有云结合的混合云架构对外提供互联网访问服务 vivo 终端客户 互联网 DNS vivo 私有云 CDN 面临的 核心问题 复杂性: 多运营商、多CDN、多机房出口,管理难度大 成本压力: 带宽费用高昂,突发流量导致额外开销 Load Balancer CDN厂A 应用 接入 服务 分区 vivo 数据 分区 云A 公有云 构建智能、高效、安全的融合流量管理 一体化解决方案 质量挑战: 网络波动、延迟、丢包影响用户体验和业务稳定性 安全风险: 内部主动上网行为失控,外部攻击威胁 运维效率: 缺乏统一视图和自动化能力,排障耗时 降低 带宽成本 提升 访问质量 强化 安全合规 提高 运维效率
13. 如何解决核心问题 DNS域名解析 CDN加速接入 统一 纳管 安全 防护 WAF拦截 带宽检测识别 主动上网接入 四七层流量接入 融合流量管理平台 如何解决 核心问题 302智能调度 机房带宽调度 质量调度 智能 决策 监控及 自动化 全链路监控 高效迁移 故障预案
14. 第二部分|融合流量管理 2.1 技术背景 2.2 平台实践 2.3 总结展望
15. 平台实践-产品架构 vivo 互联网业务 展现与交互层 控制与执行层 数据处理与分析 数据采集层 网络资源 统一管理门户 业务接入 变更管控 用量对账 业务场景 报表 OpenAPI 302智能调度 公网带宽调度 API网关 CDN源站 DNS解析 离线批处理 负载均衡配置 公网 主动上网 druid时序数据 DNSPod 自动变更 HIVE离线数据 日志 CDN日志 流量预测 业务埋点指标 NG日志 供应商A 下载速度、首包时间、可用性等指标数据 供应商B 异常检测 质量检测 监控指标数 机房网络供应商 vivo DNS 灰度变更 调度/检测算法 HDFS日志文件 DNS供应商 万网 配置下发策略编排 数据存储 机房流量数据 流量拦截防护 自动化编排 大数据平台 实时流处理 融合CDN 拨测监控 域名监控 CDN 供应商 … CDN厂商A CDN厂商B …
16. 关键能力详解:多CDN统一接入纳管及带宽治理与优化 配置融合 秒级容灾 统一配置标准,提升CDN管理效率 全网拨测点质量感知,故障自动调度 定位调整 数据融合 提供数据指标统一查看能力 成本优化 成本分摊算法、运营手段、降低30% 融合CDN 流量调度 支持多种策略,调度精准灵活 智能运维 基于全球拨测节点,智能根因定位
17. 融合CDN产品架构 统一入口接入 OpenAPI | 控制台 域名管理 融合CDN 管理平台 刷新预热 日志管理 拨测监控 配置管理 运维工具 厂商管理 接入全球主流CDN厂商能力 访问 CDN加速 多云CDN 加速 vivo终端用户 端侧质量埋点 CDN 厂商A CDN 厂商B 302智能调度 带宽调度 CDN 厂商C CDN 厂商D 智 能 解 析 VHS(vivo HTTP DNS) 调度中心 localDNS 源站 质量保障 成本优化 源站质量监测
18. 关键能力详解:302智能调度 相同地区、不同厂商、不同时间下载速度在持续动态变化 多CDN容灾 2025年7月31日 16 15 14 13 12 11 10 9 8 7 提升可用性 16 15 14 13 12 11 10 9 8 7 14:00 15:00 16:00 17:00 14:00 某地某运营商#CDN厂商A 15:00 16:00 16 15 14 13 12 11 10 9 8 7 14:00 15:00 16:00 某地某运营商#CDN厂商C 17:00 14:00 15:00 16:00 某地某运营商#CDN厂商D 业务接入成本要低 CDN质量不能差 故障切换要响应快 不同厂商带宽满足配比 17:00 某地某运营商#CDN厂商B 16 15 14 13 12 11 10 9 8 7 同一业务需要接入多家CDN 17:00 302智能调度
19. 302智能调度 - 技术方案 客户端 业务服务端 点击下载 下载接口 302调度平台 权重调度 质量调度 开始下载 结束下载 大数据平台 监控平台 埋点上报 实时计算 同时经过验证,下载速度提升,可为业务带来收益正向影响 下载速度快 → 商业化应用激活↑ → 商业化转化收益↑ 质量数据
20. 302智能调度 - 技术架构 网关接入 商店 / 游戏 / 系统升级… RPC 精细化控制 调度执行层 多重调度算法 地理位置数据 缓存数据同步 MEM + MQ 控制层 业务接入 调度策略管理 看板展示 地理位置+质量指标 调度监控 数据源管理 故障快速切换 + MySQL 实时性与动态适应 HTTP + 指标数据采集 处理层 ETL 灵活可扩展 业务指标数据上报 业务指标数据上报
21. 302智能调度 - 核心数据效果 核心数据 80+ 60亿+ <2ms 业务场景覆盖 调度执行(天) 服务端P99响应能力 >千万 >2% 秒级 商业化收入提升 下载速度提升 配置变更生效
22. 关键举措:公网带宽成本治理与持续运营 全网公网带宽年增长率 2018 2019 2020 2021 公网带宽 2022 2023 2024 2025 年增长率趋势 截至2025 年,全网公网带宽呈增长趋势 ,其中 内销机房2018年~2022年使用BGP带宽;2022年开始 2023年内销机房重点针对主动上网、埋点业务和 2018年~2022年增幅较大,自2023年开始增幅趋 切三线并进行埋点业务合规整改,当年带宽增幅较大; 出入向均衡进行带宽优化,带宽增长稳定在可控范 于平稳 2023年BGP全量切到三线;预计后续带宽增幅控制在 围内 20%以内
23. 关键能力详解:机房公网带宽调度 IDC 机房带宽调度 质量调度 构建监测数据流 带宽用量成本分摊 拨测质量监控 带宽用量归因分析
24. 机房公网带宽调度– 产品架构 调度接入 质量调度 资源看板 控制台 监控告警 调度干预 成本调度 域名解析系统 VIP地址池 VIP拨测管理 源站质量监测 故障分析 智能解析 VHS(vivo HTTP DNS) vivo全球用户 全球拨测点 地域分布 机房 机房IDC 北京 印度 新加坡 德国 vivo 厂商A 厂商B 厂商C
25. 关键能力详解 – 成本调度:公有云调度自建机房 监控采集链路 带宽调度 核心原理 SNMP交换机 数据采集 业务域名 切换执行 公有云流量计费,自建IDC带宽峰值 计费,在IDC低谷时,将公有云流量 调度决策 采集数据计算 带宽水位线 调度到自建IDC 带宽用量分析计算 实施效果 带宽用量 公有云调度IDC流量占比>60% 网络流量接入 Druid DNS解析切换 CDN源站切换 节省流量成本数百万/年
26. 第二部分|融合流量管理 2.1 技术背景 2.2 平台实践 2.3 总结展望
27. 总结与展望 运维效率 降低成本 统一运维入口,提升产品体验 CDN降本30%,公网带宽降本40% 覆盖流量接入全链路 实践总结 提升质量 营收增效 对商业化运营收入显著提升 应用商店商业化 整体下载速度提升>2% 统一纳管 统一外部供应商,屏蔽底层差异 对外提供一致的接口能力 数据来源自vivo
28. 总结与展望 未来发展方向 AI驱动的深度优化 更精准的流量预测、更智能的异常自愈 多云/混合云流量管理 将当前能力扩展海外,为公司出海的流量治理和网络访问质量保驾护航 打通端上网络访问质量和业务指标关联关系 建立业务增长和网络指标关联分析能力,持续维业务收入增长赋能
29. 谢谢!Q&A

trang chủ - Wiki
Copyright © 2011-2025 iteam. Current version is 2.146.0. UTC+08:00, 2025-10-16 19:32
浙ICP备14020137号-1 $bản đồ khách truy cập$