智驱流量,效赢增长——拨测&融合流量管理业务赋能实践
如果无法正常显示,请先停止浏览器的去广告插件。
1. 智驱流量,效赢增长—拨测&融合流量管理业务赋能实践
莫瀚 vivo互联网拨测监控负责人
周建华 vivo互联网运维平台研发负责人
2. 目录
Part 01 第一部分|全球拨测监控
Part 02 第二部分|融合流量管理
CONTENTS
3. 第一部分|全球拨测监控
1.1 什么是拨测?
1.2 vivo拨测现状
1.3 vivo拨测具备的能力
1.4 拨测如何支撑流量调度
4. 什么是拨测?
拨测是一种模拟真实用户的行为或网络访问路径,执行健康检查和性能测量的旁路监控系统
性能监控 产品优化 可用性监控
拨测技术可以模拟用户访问网络的行为,检测 拨测技术可用于对多个产品进行性能对比分析, 通过拨测技术,可以模拟用户办理各类业务的
网络的连通性、时延、丢包等指标,帮助运维 从用户角度出发,评估各产品的优劣,为产品 流程,检测业务的可用性、响应时间等关键指
人员及时发现网络故障和性能瓶颈 改进和市场策略提供数据支持 标,从而评估业务质量并优化业务流程
5. vivo拨测平台介绍
主要职责:承接业务可用性监控需求,为业务提供高可用监测服务
网络性能监控
拨测模拟用户访问网络的行为,检测网络的连通性、
时延、丢包等指标,帮助运维人员及时发现网络故
障和性能瓶颈
业务可用性监控
模拟用户办理各类业务的流程,检测业务的可用性、
响应时间等关键指标,从而评估业务质量并优化业
务流程
产品优化分析
对产品进行性能对比分析,从用户角度出发,评估
产品优劣,为产品改进和市场策略提供数据支持
网络调度检测
针对CDN网络,机房网络,运营商等基础链路发起
探测,及时发现链路问题,通过拨测结果动态调整
网络链路和策略
6. vivo拨测自有手机节点规模
国内-覆盖国内所有城市、县级市(自有手机)
10万*N 330+ 5+
国内手机数量 覆盖地级市 覆盖运营商
单日可承载拨测量
6亿+次/天
海外-覆盖主流国家和地区(自有手机)
海外手机数量(万台)
印尼
印度
越南马来
其他
7. vivo拨测系统原理图
探测地址(如HTTP://xxx)
访问异常,不可用,封禁 …
1、下发执行探测任务
拨测技术通过模拟真实用户的行为,对网络或业务进行主
动探测
任务下发服务
结果回收服务
2、数据采集与分析
在模拟用户行为的过程中,拨测技术会收集相关的性能数
据,如响应时间、丢包率等,并进行实时分析,为故障排
查和性能优化提供依据
边缘探测Agent
3、阈值和可用性告警
用户可以设定各项性能指标的阈值,当拨测结果超出阈值
时,系统会触发告警,以及时通知管理人员
8. 拨测能力介绍
任务执行
DNS检测
劫持
采集侧能力侧
链路性能检测
解析
配置调度
TCP建联
SSL握手
用户体验检测
CDN
HTTPS
可用性检测
请求
响应性能
任务调度模块
任务请求
任务管理
网页首屏/
首等能
Web检测
QUIC
私有协议
TCP
私有协议
流媒体等
策略控制模块
任务执行
IO/
数据上报
HTTPS
私有多协议
本地存储
耗电管理
执行策略管理
远程配置管控
9. 拨测能力介绍
平台能力侧
WEB报表管理
任务下发能力
任务管理
即时拨测
拨测节点管理
周期探测
省份
运营商
配置管控
节点组管理
多维度下发管理 任务统计
任务配置 …
任务分片
报表展现
告警能力
告警管理
手机状态
策略控制
指标查询
指标查询
劫持告警 CDN告警
可用性告警 …
配置管理能力
配置管理
故障分析能力
禁用启用管理
紧急关停
版本管理
快照 拨测日志
链路 …
采集策略下发
10. 拨测是如何支撑融合流量管理进行智能流量调度的
输入
IP元数据管理平台
执行
IP信息
IP可用性指标
数据 流量智能调度
基于IP指标智能调度数据 故障快速恢复
故障精准定位
IP任务关键信息
IP任务
统一网关
IP结果关键指标
流量异常检测
流量智能调度
IP信息
Ip-icmpping 可用性
……
归属运营
任务调度
结果回收
Ip-tcpping 可用性
归属业务 Ip-icmpping 延时
归属机房 Ip-tcpping 延时
归属集群
归属IDC
边缘探测Agent(真实手机+IDC)
11. 第二部分|融合流量管理
2.1 技术背景
2.2 平台实践
2.3 总结展望
12. vivo互联网流量接入现状
vivo采用自建与公有云结合的混合云架构对外提供互联网访问服务
vivo 终端客户
互联网
DNS
vivo
私有云
CDN
面临的
核心问题
复杂性: 多运营商、多CDN、多机房出口,管理难度大
成本压力: 带宽费用高昂,突发流量导致额外开销
Load
Balancer
CDN厂A
应用
接入
服务
分区
vivo
数据
分区
云A
公有云
构建智能、高效、安全的融合流量管理
一体化解决方案
质量挑战: 网络波动、延迟、丢包影响用户体验和业务稳定性
安全风险: 内部主动上网行为失控,外部攻击威胁
运维效率: 缺乏统一视图和自动化能力,排障耗时
降低
带宽成本
提升
访问质量
强化
安全合规
提高
运维效率
13. 如何解决核心问题
DNS域名解析
CDN加速接入
统一
纳管
安全
防护
WAF拦截
带宽检测识别
主动上网接入
四七层流量接入
融合流量管理平台
如何解决 核心问题
302智能调度
机房带宽调度
质量调度
智能
决策
监控及
自动化
全链路监控
高效迁移
故障预案
14. 第二部分|融合流量管理
2.1 技术背景
2.2 平台实践
2.3 总结展望
15. 平台实践-产品架构
vivo 互联网业务
展现与交互层
控制与执行层
数据处理与分析
数据采集层
网络资源
统一管理门户
业务接入
变更管控
用量对账
业务场景
报表
OpenAPI
302智能调度
公网带宽调度
API网关
CDN源站
DNS解析
离线批处理
负载均衡配置
公网
主动上网
druid时序数据
DNSPod
自动变更
HIVE离线数据
日志
CDN日志
流量预测
业务埋点指标
NG日志
供应商A
下载速度、首包时间、可用性等指标数据
供应商B
异常检测
质量检测
监控指标数
机房网络供应商
vivo DNS
灰度变更
调度/检测算法
HDFS日志文件
DNS供应商
万网
配置下发策略编排
数据存储
机房流量数据
流量拦截防护
自动化编排
大数据平台
实时流处理
融合CDN
拨测监控
域名监控
CDN 供应商
…
CDN厂商A
CDN厂商B
…
16. 关键能力详解:多CDN统一接入纳管及带宽治理与优化
配置融合
秒级容灾
统一配置标准,提升CDN管理效率
全网拨测点质量感知,故障自动调度
定位调整
数据融合
提供数据指标统一查看能力
成本优化
成本分摊算法、运营手段、降低30%
融合CDN
流量调度
支持多种策略,调度精准灵活
智能运维
基于全球拨测节点,智能根因定位
17. 融合CDN产品架构
统一入口接入
OpenAPI | 控制台
域名管理
融合CDN
管理平台
刷新预热
日志管理
拨测监控
配置管理
运维工具
厂商管理
接入全球主流CDN厂商能力
访问
CDN加速
多云CDN
加速
vivo终端用户
端侧质量埋点
CDN
厂商A CDN
厂商B
302智能调度 带宽调度
CDN
厂商C
CDN
厂商D
智
能
解
析
VHS(vivo HTTP DNS)
调度中心
localDNS
源站
质量保障
成本优化
源站质量监测
18. 关键能力详解:302智能调度
相同地区、不同厂商、不同时间下载速度在持续动态变化
多CDN容灾
2025年7月31日
16
15
14
13
12
11
10
9
8
7
提升可用性
16
15
14
13
12
11
10
9
8
7
14:00
15:00
16:00
17:00
14:00
某地某运营商#CDN厂商A
15:00
16:00
16
15
14
13
12
11
10
9
8
7
14:00
15:00
16:00
某地某运营商#CDN厂商C
17:00
14:00
15:00
16:00
某地某运营商#CDN厂商D
业务接入成本要低 CDN质量不能差
故障切换要响应快 不同厂商带宽满足配比
17:00
某地某运营商#CDN厂商B
16
15
14
13
12
11
10
9
8
7
同一业务需要接入多家CDN
17:00
302智能调度
19. 302智能调度 - 技术方案
客户端 业务服务端
点击下载 下载接口
302调度平台
权重调度
质量调度
开始下载
结束下载
大数据平台 监控平台
埋点上报 实时计算
同时经过验证,下载速度提升,可为业务带来收益正向影响
下载速度快 → 商业化应用激活↑ → 商业化转化收益↑
质量数据
20. 302智能调度 - 技术架构
网关接入
商店 / 游戏 / 系统升级…
RPC
精细化控制
调度执行层
多重调度算法
地理位置数据
缓存数据同步
MEM
+
MQ
控制层
业务接入 调度策略管理 看板展示
地理位置+质量指标 调度监控 数据源管理
故障快速切换
+
MySQL
实时性与动态适应
HTTP
+
指标数据采集
处理层
ETL
灵活可扩展
业务指标数据上报
业务指标数据上报
21. 302智能调度 - 核心数据效果
核心数据
80+ 60亿+ <2ms
业务场景覆盖 调度执行(天) 服务端P99响应能力
>千万 >2% 秒级
商业化收入提升 下载速度提升 配置变更生效
22. 关键举措:公网带宽成本治理与持续运营
全网公网带宽年增长率
2018
2019
2020
2021
公网带宽
2022
2023
2024
2025
年增长率趋势
截至2025 年,全网公网带宽呈增长趋势 ,其中 内销机房2018年~2022年使用BGP带宽;2022年开始 2023年内销机房重点针对主动上网、埋点业务和
2018年~2022年增幅较大,自2023年开始增幅趋 切三线并进行埋点业务合规整改,当年带宽增幅较大; 出入向均衡进行带宽优化,带宽增长稳定在可控范
于平稳 2023年BGP全量切到三线;预计后续带宽增幅控制在 围内
20%以内
23. 关键能力详解:机房公网带宽调度
IDC 机房带宽调度
质量调度
构建监测数据流
带宽用量成本分摊
拨测质量监控
带宽用量归因分析
24. 机房公网带宽调度– 产品架构
调度接入
质量调度
资源看板
控制台
监控告警
调度干预 成本调度
域名解析系统 VIP地址池
VIP拨测管理 源站质量监测
故障分析
智能解析
VHS(vivo HTTP DNS)
vivo全球用户
全球拨测点
地域分布
机房
机房IDC
北京
印度
新加坡
德国
vivo
厂商A
厂商B
厂商C
25. 关键能力详解 – 成本调度:公有云调度自建机房
监控采集链路
带宽调度
核心原理
SNMP交换机
数据采集
业务域名
切换执行
公有云流量计费,自建IDC带宽峰值
计费,在IDC低谷时,将公有云流量
调度决策
采集数据计算
带宽水位线
调度到自建IDC
带宽用量分析计算
实施效果
带宽用量
公有云调度IDC流量占比>60%
网络流量接入
Druid
DNS解析切换
CDN源站切换
节省流量成本数百万/年
26. 第二部分|融合流量管理
2.1 技术背景
2.2 平台实践
2.3 总结展望
27. 总结与展望
运维效率
降低成本
统一运维入口,提升产品体验
CDN降本30%,公网带宽降本40%
覆盖流量接入全链路
实践总结
提升质量
营收增效
对商业化运营收入显著提升
应用商店商业化
整体下载速度提升>2%
统一纳管
统一外部供应商,屏蔽底层差异
对外提供一致的接口能力
数据来源自vivo
28. 总结与展望
未来发展方向
AI驱动的深度优化
更精准的流量预测、更智能的异常自愈
多云/混合云流量管理
将当前能力扩展海外,为公司出海的流量治理和网络访问质量保驾护航
打通端上网络访问质量和业务指标关联关系
建立业务增长和网络指标关联分析能力,持续维业务收入增长赋能
29. 谢谢!Q&A