导读 指标中台是快手数据平台部的核心平台之一,本文将分享快手指标中台从设计到落地的实践经验。
1. 背景介绍
2. 指标管理
3. 指标服务
4. 未来展望
分享嘉宾|夏桂林 快手 指标中台技术负责人
编辑整理|赵云
内容校对|李瑶
出品社区|DataFun
背景介绍
1. 关于快手
2. 关于快手数据平台部
3. 指标相关介绍
4. 快手指标中台背景
5. 如何构建企业级指标中台
6. 快手指标中台解决方案
指标管理
1. 指标管理相关背景
2. 指标管理解决方案
指标标准化流程与规范:采用标准化的流程和规范来统一指标和维度信息的接入;
元数据管理:对接入的指标维度元数据进行统一管理;
模型管理:对指标维度等元数据进行数据建模,形成数据模型,将数据模型进行有效管理;
数据集管理:在元数据管理和模型管理的基础上形成数据集管理,对外提供统一的服务。
3. 指标标准化规范和流程
业务口径制定:在明确需求后,将制定业务口径,确保指标的定义与业务目标一致,要落实数据规范和指标命名规范。
数据开发:根据业务口径进入指标开发阶段,要落实数据开发规范和数据模型规范,并且在平台保证一致性规范。
指标服务提供:落实指标服务规范。
审批授权:为保证指标口径的统一,我们会对各业务线进行梳理,每个业务线会有对应的数据域,数据域有数据管家对指标口径进行审批和授权。
4. 元数据/模型/数据集管理
概念层(元数据管理):主要负责指标、维度、数据表以及绑定等元数据的统一管理。
逻辑层(模型管理):在元数据管理之上,我们面临的第一个问题是原始录入指标的元数据通常不能直接用于业务。例如,一个维度可能绑定多张维表,在指标服务时基于原始元数据计算维度应该从哪张维表取数是非常浪费资源的,所以需要进行数据建模,基于元数据重新梳理和构建数据关系,形成数据模型,进而提高指标使用时的查询性能。
应用层(数据集管理):第二个问题是业务线可能有成千上万的指标,用户的一些使用场景只关注少量指标,但在使用时却需要从大量指标中检索特定指标,这无疑增加了用户的理解成本和使用成本。为了解决这个问题,我们设计了数据集,即特定指标、维度和数据表的一个集合,从而缩小指标数据的范围。用户可以将关注的指标和维度圈选到一个数据集中,这样在使用看板或报表时,可以直接使用数据集提供服务,而不需要从大量指标中逐一检索。数据集也是我们对外提供服务的载体。
5. 数据建模
指标服务
1. 指标服务相关背景
2. 指标服务解决方案
3. 统一分析语言 OAX
4. 统一查询引擎 OCTO
5. 指标加速
6. 指标中台落地情况
未来展望
分享嘉宾
INTRODUCTION
夏桂林
快手
指标中台技术负责人
21 年加入快手,曾就职于 58 同城,主导标签系统、统一数据服务等多个项目从 0 到 1 建设。当前在快手从事指标体系、数据建模、数据分析等领域工作,在大数据数据分析服务领域有丰富的实践经验。
往期推荐
大模型+企业数据=下一个时代的决胜关键
新一代实时数仓:阿里云数据库 SelectDB 版--100% 兼容 Apache Doris 的全托管云原生实时数仓
国内大模型最先支棱起来的,是落地?
AB实验的采样分流技术演进以及Sutva假设与现实挑战
DataOps+大模型促进数据工程创新
大语言模型在推荐系统中的探索与应用
从0到1:广告营销多智能体架构落地全攻略
Agent+RAG:大模型真实应用场景落地探索
分布式 Data Warebase - 让数据涌现智能
点个在看你最好看
SPRING HAS ARRIVED