顺丰大数据架构稳定性保障实践

如果无法正常显示，请先停止浏览器的去广告插件。

相关话题： #顺丰

1. 大数据架构稳定性保障实践顺丰科技有限公司林国强大数据架构负责人

2. 引子 10 大数据发展至今，已经有近10年时间，在这10年时间里面，大数据架构发生了很多变化而这些变化，不断冲击当前企业大数据架构，给业务部门和信息部门都来带很大挑战 200TB 每天新增 200PB+ 存量规模如此数据规模下，如何保证大数据架构稳定性？本次演讲将会分享顺丰科技大数据团队的相关实战经验

3. 一、大数据架构历史变迁目录 • • • • • 洪荒期远古期近古期近现代现如今二、架构稳定的关键因素 • • • • • 扩展性可用性自适性易用性先进性三、未来大数据架构畅想

4. 一、大数据架构历史变迁洪荒期、远古期、近古期、近现代、现如今

5. 大数据架构变迁-洪荒期&MR MR原理 • Map/Reduce是一个用于大规模数据处理的分布式计算模型，它最初是由 Google工程师设计并实现的，Google已经将它完整的MapReduce论文公开发布了 • 其中对它的定义是，Map/Reduce是一个编程模型，是一个用于处理和生成大规模数据集的相关的实现。用户定义一个map函数来处理一个 key/value对以生成一批中间的key/value对，再定义一个reduce函数将所有这些中间的有着相同key的values合并起来。很多现实世界中的任务都可用这个模型来表达。价值 • oracle、mysql、db2等传统数据库，无法处理海量数据，日增长100亿级，每天100TB左右的离线专题数据分析 • 引入hadoop mr架构解决离线跑批问题变化 • Oracle存储全部需要改为MR/HSQL，重新编写后端调度收益 • 公司解决了大规模数据分析问题，一部分员工因为解决了关键业务痛点，脱颖而出，成立最原始的大数据团队

6. 大数据架构变迁-远古期&MPP MPP原理 • MPP即大规模并行处理（Massively Parallel Processor ）。每个节点都有独立的磁盘存储系统和内存系统，业务数据根据数据库模型和应用特点划分到各个节点上，每台数据节点通过专用网络或者商业通用网络互相连接，彼此协同计算，作为整体提供数据库服务。 • 非共享数据库集群有完全的可伸缩性、高可用、高性能、优秀的性价比、资源共享等优势价值变化收益 • 架构简单，端到端解决湖和仓的问题，在中小规模场景下，比较有优势，解决了原来hadoop架构响应速度和并发度问题（Scalability：100级别），并且开发人员只需掌握sql即可 • 针对中小规模场景下，可以直接替换hadoop • 在大规模场景下，需要作为hadoop的后端输出承载，面向业务侧提供高价值数据分析 • 公司使用更加简单架构，更简单的开发模式，应对不断变化的需求，一部分员工因为对mpp熟悉，独立一个团队，专注此项工作

7. 大数据架构变迁-近古期&Storm Storm原理 • Storm采用Master/Slave体系结构,分布式计算由Nimbus和Supervisor两类服务进程实现,Nimbus进程运行在集群的主节点,负责任务的指派和分发,Supervisor运行在集群的从节点,负责执行任务的具体部分。 • Nimbus： Storm集群的Master节点，负责资源分配和任务调度，负责分发用户代码，指派给具体的Supervisor节点上的Worker节点，去运行Topology对应组件（Spout/Bolt）的 Task。 • Supervisor： Storm集群的从节点，负责接受Nimbus分配的任务，启动和停止属于自己管理的worker进程。通过Storm的配置文件中的supervisor.slots.ports配置项，可以指定在一个Supervisor上最大允许多少个Slot，每个Slot通过端口号来唯一标识，一个端口号对应一个Worker进程（如果该Worker进程被启动）价值变化收益 • storm没出来之前，大家主要是写后端的预警程序，实现实时预警，需求响应时间长，且大规模场景下的处理非常复杂，storm之后，有一个相对好的架构，支撑实时流处理业务，能够更快速响应业务，处理海量实时数据 • 需要把原先java、c、c++等编写的流处理程序，切换到storm，有一定的迁移工作，但是架构更稳定 • 公司有更弹性、更简单的架构处理实时流数据，能更快速应对业务需求，同时，一部分员工因为对这部分比较熟悉，成立实时数据团队

8. 大数据架构变迁-近现代&Flink/Spark Flink原理 • Flink 是一个流处理框架，支持流处理和批处理，特点是流处理可容错、可扩 Spark原理 • Spark是一个围绕速度、易用性和复杂分析构建的大数据处理框架，最初在展、高吞吐、低延迟。批处理是只有处理一批完成后，才会经过网络传输到 2009年由加州大学伯克利分校的AMPLab开发，并于2010年成为Apache的下一个节点，流处理的优点是低延迟，批处理的优点是高吞吐开源项目 • Spark基于内存的迭代计算框架，适用于需要多次操作特定数据集的应用场合。需要反复操作的次数越多，所需读取的数据量越大，受益越大 • 价值：Flink比Storm的吞吐性能更强，具备一定的批处理能力，技术生态栈支持更广，架构更统一。 • 变化：需要把基于storm编写的实时流处理程序，迁移至flink，改造量还是比较多 • 收益：公司具备吞吐性能更强的流处理架构，基于flink能够做更多场景，如实时预测、实时TF；由原来实时流处理团队负责这部分架构 • 价值：Spark相比Hadoop mr架构，计算过程不需要反复落盘，减少大量IO 操作，大大提高计算速度。且技术生态栈较广，很好支持ML和流处理相关板块。 • 变化：从HSQL迁移至Spark SQL，最开始时，还是需要不少工作量； • 收益：公司离线数据湖计算能力大致提高了2~3倍；成立一个新的算法团队，承担Spark计算框架业务

9. 大数据架构变迁-现如今&实时数据湖架构实时数据湖原理 • Hudi是Hadoop Updates and Incrementals的简写，它是由Uber开发并开源的Data Lakes解决方案，最初是用于解决数仓中 Lambda 架构中数据一致性的问题，将增量处理模型替代流式处理模型，并提供了 Upsert 和 Incremental Pull 两个非常重要的 feature • Update/Delete记录：Hudi使用细粒度的文件/记录级别索引来支持 Update/Delete记录，同时还提供写操作的事务保证。查询会处理最后一个提交的快照，并基于此输出结果。 • 变更流：Hudi对获取数据变更提供了一流的支持：可以从给定的时间点获取给定表中已updated/inserted/deleted的所有记录的增量流价值变化收益 • 解决了lambda架构指标一致性和资源重复投入问题，同时提高了指标分析时效性，提升了管理和运营的决策效率 • 从hive/spark切换到hudi体系，会在数据接入侧需要进行调整，从overwrite切换为merge into，开发侧需要修改增量获取方式，代价不大，局部改动 • 业务指标时效，从T+1天到T+0，大大提升了指标时效，面向业务侧具备显性价值。同时，一部分员工因为比较熟悉，单独成立实时数据湖团队

10. 二、架构稳定的关键因素扩展性、可用性、自适性、易用性、先进性

11. 架构稳定性关键因素-扩展性 • 纵向扩容（增加单节点CPU、内存和存储）大数据计算服务 • 横向扩容（增加节点，增大集群规模） • 存算分离（按计算或者存储分开扩容，且 Spark Presto Flink 大数据存储与查询服务 Hive ES CH Doris HBase 复用容灾资源和公有云弹性资源） ① 计算资源调度弹性大数据服务 • 组件容器化 • 存储与计算分离 • 资源弹性伸缩 ② 组件部署资源调度大数据资源调度引擎 ④ 高峰及容灾资源调度 ③ 日常资源调度生产计算节点计算 Cache 容灾计算节点顺丰云EC2 Cache Cache 200Gbps 公有云EC2 公有云EC2 Cache Cache 20-200Gbps 跨机房缓存 • 统一名字空间 • 数据分层存储及分布策略 • 数据加密存储加密传输跨机房存储：HDFS • 存储资源弹性上云 • 多云部署大数据资源控制中心存储 HDFS 对象存储S3 本地IDC 部署API 顺丰云 EC2 API 公有云 EC2 API 资源弹性伸缩自动部署

12. 架构稳定性关键因素-可用性&容灾双活 Yarn HBase 难点：跨机房部署带宽压力大难点：客户端与业务系统嵌入深，解决方案：切换难改造源码，通过标签调度结合解决方案： HDFS跨机房容灾、Alluxio，实现建立HBase管理平台，提供HBase 跨机房双活 SDK，实现远程一键切换 HDFS ElasticSearch Kafka 难点：跨机房部署性能低、不稳定难点：双活依靠双写，有一致性问题，难点：主备集群间偏移量不一致，客户效率低，客户端不便切换端与业务系统嵌入深，切换难解决方案：解决方案：改造源码，通过CCR方式实现数据主从建立Kafka管理平台，改造同步；建立数据服务平台，让ES的使用 MirrorMaker，实现偏移量的同步，并服务化提供Kafka SDK，实现远程一键切换解决方案：改造源码实现双活

13. 架构稳定性关键因素-可用性&容灾双活 1、我要写份数据，3副本 APP 2、返回2个同机房DN作为写 Pipeline:DN1->DN2 4、我的数据写完了 Namenode（Active）块分布管理同步管理 ü 写入性能：3副本->2副本 ü 同步效率：DistCP->自动块分布 ü 存储利用率：6副本->4副本 ü 带宽保障：任务级限流->整体限流 7、通过返回数据同步任务： DN3（block 1）-> DN4 高效自动 5、通过返回跨机房同步任务： DN2（block 1）-> DN3 3、建立数据写通道，写入数据 Datanode 2 Datanode 1 Datanode 3 6、拉取数据块 3、Pipeline … 安全 … Datanode 4 8、拉取数据块 … …

14. 架构稳定性关键因素-自适性&自动化评估人工 5 风险评估全自动 4 容量评估 6 诊断项沉淀定期体检：诊断系统核心指标，规避潜在风险 - 精细化运营 - 用户侧反馈根据用户容量变化指引自动扩缩容运营 3 压力评估 2 性能评估 - 运营安全性 - 容量、预算上线 - 业务逻辑性能评估 - 性能调优测试开发诊断性能数据指标数据容量数据诊断项数据 1 解决方案选型根据业务场景，评估推荐方案采集应用性能容量健康度监控告警弹性伸缩性能评估风险预警

15. 架构稳定性关键因素-易用性&批流一体化 Type: Kafka/Hive/MySQL/… Database: xxx Table: xxx Fields: xxx Meta: {host, port…} SQL: insert overwrite into … Type: Stream/Batch Type: Kafka/Hive/MySQL/… Database: xxx Table: xxx Fields: xxx Auth: {create, write, read…} Flink SQL 元数据管理权限管理 SQL Parser 转变为原生的Flink SQL Engine Adapter 实时表：Kafka 字段级权限与审计离线表：Hive 跨租户权限管理（库、表、字段、血缘） UDF、序列化方式 Stream Processing Batch Processing 实时计算Env Yarn/Kubernetes 批处理Env

16. 架构稳定性关键因素-先进性&数据仓库实时化数据仓库架构 ODS DWD DIM DWS DM Queries SQLServer Incremental ETL Clickhouse CDC、Binlog Hudi on Flink 实时ETL Clickhouse 微服务、应用 ODS Kafka Kafka

17. 三、未来大数据架构畅想

18. 产业趋势传统大数据厂商核心打法：平台（私有化为主）+数据治理+定制化开发方式发展情况：基本没有太多创新，更多是项目方式，项目毛利平均在40%左右。行业上主要聚焦在金融、政府、零售、地产、制造，平均实施周期2~3月核心打法：聚焦单品发展情况：都布局云原生数据湖能力，如datalake 发展情况：商业模式就是单品，不承接数据治理和产品，相对早期，市场感知度不强。大数据EMR的定制化开发，做好标准化（SQL）支持、接口开放布局相对成熟些，行业打法上，目前还是以生态为性和线上运营支持。聚焦金融、互联网、零售、央主，聚焦IaaS。平均实施周期1~2天国企、制造等行业，平均实施周期1~2天。主要代表产品：AWS EMR、Alibaba EMR、 Cloudera一定程度上增加弹性能力，解放IT维护成本主要代表产品如：***Datalake通过存算分离、弹性伸缩等技术，实现动态伸缩和精准计费 Hadoop技术路线，存算一体 l Hadoop技术路线，存算一体 l 计算存储分离、精细化资源管理 l 以私有化为主，按节点license结算 l 依托公有云IaaS资源，以EMR形式对外提 l 具备DLF能力（元数据迁移、对象存储元 l 除大数据节点外，提供数据治理和定制供服务 l 降低集群扩缩容和运维自动化成本云原生实时数据湖云原生数据湖 l 化开发服务第四代云上数仓（萌芽期）第三代云上数仓（幻灭期）云上数据湖私有化数据湖 Snowflake、Databrick 核心打法：云基础设施+生态能力第二代云上数仓（成熟期）第一代云上数仓（发展期）主要代表产品：***等厂商，相比传统oracle、 db2，解决大规模OLAP分析场景新兴独角兽、科技公司公有云厂商数据发现、元数据管理） l 主要代表产品：snowflake、databricks 等，通过存算分离、实时数仓、多云融合等核心技术，实现弹性伸缩和多云统一架构 l alibaba cloud、tencent cloud等 l 支持实时数仓统一架构，实现批流合一和数仓指标实时化通过弹性伸缩，降低计算成本，同时提供 DLF能力，帮助客户快速建仓多云适配，AWS、Azure、GCP、 l 兼顾私有云的数据安全需求和公有云的弹性资源需求

19. 场景趋势 “实时数仓，批流合一”场景 “存算分离，弹性伸缩”场景 “多云管理，跨云计算”场景 • 面向金融、快消零售和物流行业，以前大部分 • 金融、快消零售和物流行业具备季节性属性， • 跨国企业和大型央国企，业务常涉及多朵云，业务高峰时后台计算资源需求成本增长，扩充比如某化妆品企业两朵云、某零售头部企业三 IT资源耗资巨大且浪费朵云、某奶制品巨头国内三朵云等指标是T+1天，少部分T+0 痛点 • 客户需求大部分指标1分钟内呈现，使用离线+ 实时lambda架构，不仅耗费大量资源，还会出现指标不一致情况，如某垂直电商 • 容灾机房、公有云等资源池无法充分利用，这两部分的闲置计算资源较多 • 如何解决多云环境下，统一数据湖管理和合规跨云计算，是客户最关心的问题 • 目前主流实时数仓技术hudi，虽已开源但是有不少生产问题，包括性能和稳定性问题，离实说明际生产应用还有一段距离 • 顺丰在这个基础上，已经解决了社区尚未解决的问题，并在内部落地，数仓计算效率提高4倍，数仓时效到1分钟以内 • 目前国内主流公有云云目前只聚焦在自家单朵云的弹性伸缩能力上发展 • 我们从客户角度出发，目前已经具备混合云弹性伸缩能力 • 目前Snowflake和Databricks支持多云适配，但不支持跨云统一管理 • 顺丰已经支持多云管理和部分跨云计算

20. 架构趋势云原生实时数据湖，打造存算分离、实时数仓、湖仓一体三大核心能力客户价值：T+1-->T+0 天下武功、唯快不破，谁的数据结果出得快，谁赢的可能性就越大 T+1天源端 T+1天（数据库、埋点、文件）离线数据湖 T+1天（ODS、DWD、DWS） MPP引擎（DM）管理决策业务运营市场营销业财一体 T+0 源端（数据库、埋点、文件） T+0 风险管控实时数据湖（ ODS、DWD、DWS 、DM）

21. 关键能力-极致弹性（成本极致优化） • 通过存算分离技术，复用容灾和公有云资源，确保了数据安全的同时，复用公有云弹性资源弹性大数据服务：组件容器化、存储与计算分离、资源弹性伸缩大数据存储与查询服务大数据计算服务 Spark Presto ES CH Flink Hive Doris HBase ② 组件部署资源调度 ① 计算资源调度大数据资源调度引擎 ③ 日常资源调度 ④ 高峰及容灾资源调度计算生产计算节点 Cache 200Gbps 容灾计算节点顺丰云EC2 Cache Cache 20-200Gbps 公有云EC2 公有云EC2 Cache Cache 跨机房缓存：统一名字空间、数据加密存储、数据分层存储及分布策略加密存储存储 HDFS 大数据资源控制中心对象存储 S3 跨机房存储：HDFS、存储资源弹性上云、多云部署本地IDC部署API 腾讯云EC2 API 公有云EC2API 跨机房存储：HDFS、存储资源弹性上云、多云部署

22. 关键能力-实时数据湖（指标 T+1天->T+0 ） • 基于Hudi升级后大幅提升的数仓更新时效，由原来的“天”级别提升到“秒”级别数据源 CDC 实时集成 kafka Flink 批流融合业务库 HBase/Redis 维表业务消息队列埋点数据物联网IOT CDM 批量集成 Spark 增量处理 HDFS存储应用层 Doris 实时OLAP APP ClickHouse 实时OLAP Hudi专题数据 Hudi ACID高效增量管理日志数据专题集市元数据 Redis专题数据可视化 BI报表 Hbase专题数据 ES专题数据自助分析

23. 关键能力-统一SQL（开发更高效&高速）跨云、跨大数据引擎全局统一元数据管理，支持基于代价估算的全局解析执行引擎支持的融合分析支持无感优化用户大数据架构，支撑已有技术生态，实现向云上数仓的平滑过渡多源融合弹性计算框架 Unified Meta All on SQL Distributed CBO 弹性大数据组件 Presto Spark Hive Doris Flink Elasticsearch Share nothing Cache 多源融合弹性计算框架统一大数据存储顺丰云弹性资源调度公有云私有云

24. 关键能力-安全托管（安全计算）确保客户对数据密钥有自主管理权确保通信从南北向到东西向都是安全的，确保数据落地的加密程度是足够密钥管理 KMS密钥生成 KMS密钥托管生物密钥加盐生成器 RPC服务层白名单过滤南北向链路SSL 东西向链路SSL 库表列行权限控制弹性存储层全数据AES256强加密密钥周期性更新数据定期重新加密

25. 关键能力-数据生态（数据生态共赢）默认为每一个公有云和私有云客户部署一个联邦学习节点，数据不共享，但是模型参数共享，构建隐私计算数据交易市场商家A 商家B 商家C 商家D 商家E 二方数据一方自有数据商家F 三方数据 CRM ERP 社交数据电商数据电商合作数据百度合作数据 OTWB … … 广告数据 … … 通信合作数据 … … 移动数据访问数据日志数据搜索数据数据上云安全问题偏好数据联邦学习物流数据信用数据活动数据位置数据数据安全合规问题

26. 顺丰-云原生实时数据湖我们的使命： “让每个用户的数字化更简单、更安全、更高效，为全球数字经济和人类美好生活贡献力量” 扫码申请体验