⼤众点评内容平台架构实践
如果无法正常显示,请先停止浏览器的去广告插件。
1. 众点评内容平台架构实践
2. 录
3. 背景介绍
3
4. 背景介绍
业务简介
内容
内容平台
产
内容消费
推荐
评价\笔记
话题
榜单
频道
活动演出
免费试
站外
4
5. 背景介绍
建设标准化的内容存储、处理和分发的流
线系统,实现内容的
体化管理
5
平台定位
6. 背景介绍
7. 优化实践
7
8. 内容模型标准化
初创期
8
9. 内容模型标准化
10. 内容模型标准化
11. 内容模型标准化
12. 内容模型标准化
13. 内容模型标准化
逻辑模型
星型模型:事实表(主体)+ 维度表(四
刚),表达内容基础结构
分类
类
标签
DDD:聚合根(主体)+ 实体(四 刚)+ 值对象(属性)
KEY1 : VALUE1
……
KEYn: VALUEn
位置
属性合并:将含义相似且可能被同时使
Meta属性: 图
宽
的属性做聚类,以便理解和应
、视频码率、经纬度等原
KEY1 : VALUE1
……
KEYn: VALUEn
政区等
分类:美 等
标签:
、购物、亲
时效
KEY1 : VALUE1
……
KEYn: VALUEn
主体
属性
图片
同质属性: 位置:城市、商圈、
KEY1 : VALUE1
……
KEYn: VALUEn
像、敏感、热点等
POI
视频
文本
meta 其它 meta 其它 meta 其它 meta 其它
KEY1 : VALUE1
……
KEYn: VALUEn KEY1 : VALUE1
……
KEYn: VALUEn KEY1 : VALUE1
……
KEYn: VALUEn KEY1 : VALUE1
……
KEYn: VALUEn KEY1 : VALUE
……
KEYn: VALUEn KEY1 : VALUE
……
KEYn: VALUEn KEY1 : VALUE
……
KEYn: VALUEn KEY1 : VALUE
……
KEYn: VALUEn
时效:分发开始、分发结束等
Meta属性与维度表绑定,
同质属性因其来
不同维表,则建新的维表,与事实表关联,并可按需创建
13
14. 内容模型标准化
15. 内容模型标准化
物理模型
关系型数据库
ContentVideo
n
视频维表
关联
1
1
关联
n
ContentCategory
FA_HLModule
关联模块表
类目属性集
事实表(主体)+ 主维度表(四
刚)+ 扩展维表
结构化:可映射内容逻辑模型,易于理解
ContentPic
n
图片维表
ContentText
关联 1
关联 1
ContentBase
内容事实表
1
关联
关联
n
ContentTag
标签属性集
n ContentGeoLocation
位置属性集
n ContentEffPeriod
时效属性集
扩展性:维度表可扩展,执
DDL即可。
n
POI维表
ContentRelation
内容关联内容表
1
1
n
文本维表
ContentComponet
关联
n
关联
核心基础表
1
1
关联
1
关联
属性集表
扩展表
n
ContentExt
扩展信息表
JSON
Meta属性集 、扩展字段
灵活性:半结构,可记录个性化属性,解决异构内
容存在的离散差异点,并
扩展性:
可
持按需解析。
需修改表结构,属性可按需扩展,并且
持建索引优化查询。
15
16. 能
模型标准化
发展期
16
17. 能
18. 能
模型标准化
HOW
拆解
能
:基于输
流程:对能
引
采取某些处理
进
为得出输出的功能模块
编排调度,输出处理结果的过程
能
封装
静
插件化架构思想
•定义契约,沉淀能
实现不同程度的能
复
能
引擎
流程
动
•按照契约调度和编排能
编码
实现流程的调度
静
能
池
拆
动
能
组合
动
池
能
?
静
能
过程式编码
x 解耦
组合
组合配置
规则
•定义契约,配置能
的组合规则
实现流程的抽象和可配
逻辑
18
19. 能
20. 能
21. 能
引擎特点:记录中间状态、失败可
恢复、异常可追踪
适合场景:流程复杂, 如内容处理
流程,涉及多种组合关系,且执 时
间不可控的场景
能
模型:接
扩展:封装接
+ DSL + 引擎
,修改DSL将其编
流程维护:管理DSL即可
流程扩展:编写DSL,配置能
的组合关系
21
22. 稳定性优化
成熟期
22
23. 稳定性优化
24. 稳定性优化
减压-请求去重
权衡:延时、吞吐压
分内容类型采样
80
60
40
不同内容类型的可去重率
20
0
攻略
、视频等均需要做安全审核
•短时间内,安全审核会返回多次审核结果,频次不可控
•系统吞吐需求被放
•每条内容,包括图、
60
可去重
80
20
评价
分时间窗
笔记
话题
短视频 免费试
采样
不同时间窗
40
的可去重率
0
1s
2s
5s
10s
15s
20s
30s
24
25. 稳定性优化
减压-请求去重
权衡:延时、吞吐压
时间窗
应
去重引擎
定时器:延时队列定时功能,定时触发实际执
执
层:内容处理请求减少70%以上
存储层:数据库读写压
合并器:缓存待处理请求
可配
降低30%左右
基础层:服务器资源节省约25%左右
器:处理请求,并清理缓存
25
26. 稳定性优化
隔离-分级处理 权衡:延时、影响 ,“重点”内容优先处理
分级原则
核 内容来源优先:
户创作 > 其它来源
核 内容类型优先:评价、笔记 > 其它类型
动态调配
分配基本配额,并根据实际执
未使
优先级队列,防
情况,
第 级队列
第 级队列
调整
低优先级饿死
26
27. 稳定性优化
可观测能
建设
全链路可视化
志
链路定义:描述处理流程的DSL
链路染
:定义链路某次执
链路上报:构建
的唯
标识
志组件,搜集上下
链路存储:包括链路级、节点级和明细等三类
志
27
28. 稳定性优化
可观测能
建设
执
①快速定位异常点(红
)
③通过
志明细定位根因
②快速判断是否偶发异常
ERROR
28
29. 三
总结展望
29
30. 总结展望
31. Q&A
31