计算密集型应用以ServiceMesh为支点解决分布式问题的探索与实践

1. 计算密集型应用以Service Mesh为支点解决分布式问题的探索与实践京东集团架构师 / 王志龙

2. 个人简介  10年+互联网一线研发及架构经验，Kubernetes Contributor，Layotto Wasm Maintainer，专注云原生领域，擅长性能极限优化。  曾工作于腾讯、阿里，参与过微信 PaaS 云平台从0到1 建设，阿里 Serverless C++ 和 Golang Runtime 研发及落地。  目前工作于京东集团搜索与推荐部，负责京东搜推微服务治理和新一代 Serverless 云化平台研发工作。

3. 目录一、 Mesh溯源及背景介绍二、落地挑战和方案选型三、业务赋能探索&实践四、技术布局与未来展望

4. 一、Mesh溯源及背景介绍

5. 起源于 Buoyant 内部分享，从落地到概念专门的一层基础设施；负责可靠传输；轻量的网络代理；对应用程序透明 2016.09.29 Buoyant 2016.01.15 初次发布 2016.09.29 概念诞生 Micro-Service => Service Mesh 一脉相承 William Morgan Buoyant CEO 服务网格理念的提出者和先行者以及最早的布道师

6. 典型形式 —— Sidecar 部署一般为 Pod 多容器，但是随着 Node 模式的演进，载体多样化起来，但整体形式一致

7. 服务网格和 Sidecar 的关系绿方块为服务，蓝方块为边车部署的代理，多个 Sidecar 之间的连接和交互组成了 Mesh 右转90°

8. 从微信 Svrkit 框架与业务分离方案，回看 Mesh 的意义基础框架作为承上启下的重要一环：对下充分利用底层系统能力，对上提供灵活可靠的底座方案6 方案7 框架(bin) + 业框架bin + 务（bin + 多 filter bin + 业 so）务bin 方案1 方案2 方案3 方案4 方案5 框架(bin) + 框架(so) + 框架，业务一起框架(bin) + 框架(bin+支持插业务(so) 业务(bin) 编译业务(bin) 件) + 业务（bin）消除框架侵入 √ √ √ √ √ √ √ √ 消除代码浸入 √ √ √ √ √ √ √ √ 可观察性中中中高高高高高可测试性中中中高高高高高可扩展性中中中较高高很高很高很高分离度中中低较高高很高很高很高业务代码修改量低低不需要低低低低低运维修改量较高较高低中中高高高基础模块梳理量高高中高高高高高框架开发量中中低较高高高高高与框架发展契合度低低低高高高高高 - - 栏目目标潜在风险栏目细分 So符号未定义和符号冲突符号冲突 - - - So符号未定义和符号冲突方案八框架bin容器 + 多bin

9. 当年的基于 Envoy HTTP 通道传输私有协议方案

10. 如今的 Service Mesh 百家争鸣，百花齐放

11. Mesh——协调微服务能力和分布式压力的一个支点微服务分散能力日益复杂多样的需求高效迭代和极致性能分布式大促突发大流量挑战分散压力解决系统复杂度问题跨部门跨语言联动解决系统性能问题逻辑垂直拆分共性问题难聚焦复用物理横向拆分 …… 小语种服务治理弱 …… ……

12. 二、落地挑战和方案选型

13. 搜推广等计算密集型应用特点及落地挑战数据量大计算密集链路复杂实时性高

14. 技术选型 Proxy 性能损耗 vs Proxyless 业务耦合 —— Proxy无损耗？！ VS MOSN 多协议框架快速落地，中长期使用 MoE “双语”扩展

15. MoE —— Mosn On Envoy 研发效能高（Golang）处理性能高（C++）

16. 多集群多主控制面架构

17. 多形态数据面&多数据面 + 多控制面架构

18. 三、业务赋能探索&实践

19. 跨语言、多协议去中心化网关 HTTP网关下沉到数据面=>私有协议RPC调用 TP99 降低 50%，抖动明显好转，可用率提高一个数量级

20. 异构环境负载均衡——加权最小连接数加权后不同规格机器可以相对均匀， TP99 降 5ms，但是个别算力或容器跟物理机差别大的，依然会不均匀

21. 复合多策略负载均衡——加权&本地耗时感知&远端负载感知可根据业务需要设置 CPU 保护水位，打开远端负载感知常规流量 CPU TP75 63%=>60%，TP99 降 8 ms EDF

22. 基于Envoyfilter下发的混合跳步CPU/QPS自适应限流应对突发大流量与业务内嵌限流的关键指标对比对比项业务内嵌 MOSN 差值生效速度 19s 12s -36% 限流CPU 80% 78% -2.5% 限流可用率 83% 88% +6% Little’ s law : L = λ W 传输 BDP = BW * RTT 应用 TW = TPS * LATENCY T ≈ QPS * Avg(RT) CPU/QPS 动态限流应对常规流量，可用率更高，TP99更低 cpu超过上限值，快速限流（按当前cpu与上限值等比例限流） cpu在上下限内，缓慢探测（按delta比例小幅探） cpu低于下限值，快速恢复（按delta比例大幅扩大流量）

23. 测试环境治理——单模块 Mock 测试屏蔽个性化影响，提高压测效率；数据面一次修改，所有模块透明复用，一劳永逸；目前测试提效20%+

24. 流量分组——以 Debug 流量为例路由动态别名，实例按需分组，赋能异常流量测试，跨集群流量调度，动态扩分片，全流量实验

25. 基于 eBPF 的旁路无侵入观测零侵入，跨语言，高扩展，低损耗 —— 有效快速解决跨语言异构系统、多模块的问题紧急排查和定位

26. 四、技术规划与未来展望

27. LiMoE = Layotto in MOSN on Envoy “能力 X 性能” Attachment RDMA TCP/IP 1MB Avg-Latency: 431, 90th-Latency: 437, 99th- Latency: 443, 99.9th-Latency: 446, Throughput: 1942.76MB/s, QPS: 1.98938k, Server CPU- utilization: 105%, Client CPU-utilization: 33% 2000qps Avg-Latency: 632, 90th-Latency: 781, 99th- Latency: 857, 99.9th-Latency: 982, Throughput: 1459.37MB/s, QPS: 1.4944k, Server CPU- utilization: 83%, Client CPU-utilization: 31% 1500qps 3MB Avg-Latency: 1180, 90th-Latency: 1188, 99th- Latency: 1203, 99.9th-Latency: 1208, Throughput: 2040.34MB/s, QPS: 0.696435k, Server CPU-utilization: 108%, Client CPU- utilization: 34% 700qps Avg-Latency: 1898, 90th-Latency: 2131, 99th- Latency: 2357, 99.9th-Latency: 2484, Throughput: 1495.25MB/s, QPS: 0.510379k, Server CPU-utilization: 86%, Client CPU- utilization: 26% 510qps 5MB Avg-Latency: 1918, 90th-Latency: 1930, 99th- Latency: 1945, 99.9th-Latency: 1952, Throughput: 2188.17MB/s, QPS: 0.448137k, Server CPU-utilization: 129%, Client CPU- utilization: 36% 450qps Avg-Latency: 2569, 90th-Latency: 2656, 99th-Latency: 3939, 99.9th-Latency: 4227, Throughput: 1830.62MB/s, QPS: 0.37491k, Server CPU-utilization: 99%, Client CPU- utilization: 33% 375qps 10MB Avg-Latency: 3774, 90th-Latency: 3781, 99th-Latency: 3793, 99.9th-Latency: 3808, Throughput: 2491.11MB/s, QPS: 0.25509k, Server CPU-utilization: 130%, Client CPU- utilization: 37% 250qps Avg-Latency: 6127, 90th-Latency: 7398, 99th- Latency: 7662, 99.9th-Latency: 8391, Throughput: 1477.67MB/s, QPS: 0.151314k, Server CPU-utilization: 86%, Client CPU- utilization: 25% 150qps

28. Istio Ecosystem——基于 Admiral 智能自动化流量调控 WLARA LB 服务集合跨逻辑集群跨物理集群智能流控

29. Mesh Node 化架构赋能新一代 Serverless 平台

30. 欢迎技术交流

31.