火山引擎RTC全球化架构设计
如果无法正常显示,请先停止浏览器的去广告插件。
1. 火山引擎RTC全球化架构设计
火山引擎/游望秋
2.
3. 大纲
• 为什么RTC需要全球化能力
• 媒体全球化
• 信令全球化
• 总结
4. 为什么RTC需要全球化能力-场景介绍
RTC:Real Time Communication/实时音视频
特点:低延迟
直播连⻨ 视频会议
互动课堂 游戏语音
5. 为什么RTC需要全球化能力-体验
根据ITU-T G.114的建议:
延时低于400ms的通话体验是可接受的,
低于200ms是令人愉悦的。
全球化的目的:
降低延时,提供愉悦的RTC体验
ITU-T G.114
6. RTC通话过程拆分
一次RTC通话的交互
1. 进房、发布、订阅消息(信令)
2. 发布、订阅流(媒体)
RTC全球化 = 信令全球化 + 媒体全球化
7. RTC全球化-整体架构
全球实时音视频云
1. 边缘计算
2. 全球实时传输网
3. 异地多活
4. 信令全球同步
8. 大纲
• 为什么RTC需要全球化能力
• 媒体全球化
• 信令全球化
• 总结
9. 媒体全球化-架构
1. 边缘机房全球覆盖
2. 就近接入、边缘聚合
3. 全球实时传输网
4. 稳定性
10. 媒体全球化-边缘机房建设
覆盖200+国家和地区
全球20+供应商
11. 媒体全球化-就近接入
用户->边缘 单向平均延时 70ms
12. 媒体全球化-边缘聚合
用户分散
级联过多
带宽浪费,系
统容量降低
边缘聚合
13. 媒体全球化-实时传输网
构建在 公共互联网上的overlay网络,提供有QoS
保障的全球网络传输服务
· 为两点间选择最优质(延时,丢包,稳定性)链路
· 故障时,自动切换到可用链路
网内e2e单向延迟最大值160ms
14. 媒体全球化-稳定性
1. 同一地区引入多家供应商
2. 下发多个边缘节点地址,边缘择优连接
3. 建连失败发送负反馈,调度拉黑节点
15. 大纲
• 为什么RTC需要全球化能力
• 媒体全球化
• 信令全球化
• 总结
16. 信令全球化
1. 房间中的用户能互相感知(必须满足)
2. 信令能被尽快处理(极致追求)
单中心
多中心+中心
化房间
多中心+分布
式房间
多中心+分布式房
间+统一接入
多中心+分布式房间+
统一接入+边缘下沉
17. 信令全球化-V1 单中心 | 动态加速
全球只部署一个Core IDC(中心机房),所
有信令消息通过动态加速回源到中心机房
信令平均延时:
1. 国内:250ms
2. 海外:1s+
18. 信令全球化-V2 多中心 | 机房建设
全球范围内建设多个中心机房,中心机
房内进行 单元化部署
用户感知模式:
中心化房间
分布式房间
19. 信令全球化-V2 中心化房间
中心化房间:一个房间的信息只属于某个中心机房
引入region:全球一致性房间归属服务
信令平均延时:
1. 房间属于本机房:300~500ms
2. 房间属于其他机房:400+ms
20. 信令全球化-V3 分布式房间
分布式房间:一个房间内的信息在多个中心
内都有完整数据
信令平均延时:300ms
21. 信令全球化-V3 分布式房间 | 同步模式
同步数据量太多,且大量数据无价值怎么办?
全同步
定义
业务特征
实时同步房间、用
户、流信息
半同步
实时同步房间信息,
有当房间碰撞时,开
启房间内用户、流的
同步
用户广泛分布于世界 大量用户集中在单个
各地,如直播连⻨、 地区,如教育
跨国公司视频会议
自适应切换
半同步
全同步
22. 信令全球化-V3 分布式房间 | 数据同步稳定性
专线
CN
公网
CN
US
HK
US
专线
专线
SG
公网
海缆、陆缆,经常故障,故障持续时间⻓,修复慢
1.多径传输
2.公网relay,不强依赖专线
3.消息保序
23. 信令全球化-V4 分布式房间 | 统一接入
信令通道和媒体通道统一
信令平均延时230ms
24. 信令全球化-V4 分布式房间 | 逻辑下沉
信令 账号管理
配置 ……
DB
中心机房
统一接入
媒体服务
边缘信令
边缘机房
异步
中心信令 账号管理
配置 ……
中心机房
DB
将进房、发布、订阅等逻辑下沉边缘
信令平均延时:100ms
25. 信令全球化-V4 分布式房间 | 中心机房稳定性
南京
专线
公网
边缘机房
北京机房
公网
多径传输
ping
北京机房
边缘机房
ping
河北机房
自动切换
接入故障
• 接入网络故障,比如单运营商线路故障
• 多径传输
• 接入网关故障,比如nginx故障
• 多机房实时探测,自动切换机房
26. 信令全球化-V4 分布式房间 | 中心机房稳定性
AIOps
监控稳定性
切换机房
业务服务故障
北京机房
边缘机房
河北机房
• AIOps实时监控机房稳定性,自动切换灾备
机房
27. 信令全球化 - 回顾
单中心
国内:250ms
海外:1s+
多中心+中心
化房间 多中心+分布
式房间 多中心+分布式房
间+统一接入 多中心+分布式房间+
统一接入+边缘下沉
最优:300~500ms
最差:400+ms 300ms 230ms 100ms
28. 大纲
• 为什么RTC需要全球化能力
• 媒体全球化
• 信令全球化
• 总结
29. 指标
端到端网络延迟
400ms达标率:99.4%
200ms达标率:99%
5s进房成功率:99.5%
30. 总结
全球化
边缘计算
全球分布
就近接入
实时传输网
统一接入 信令下沉
调度 稳定性
边缘聚合
异地多活
单元化部
署
分布式房
间
数据同步
稳定性
AIOps
31.
32.