ABC场景驱动下,如何制定数据库与存储技术规划
如果无法正常显示,请先停止浏览器的去广告插件。
1. 全球敏捷运维峰会 广州站
2. ABC场景驱动下,如何制定数据库与存储技术规划
vivo
肖博
全球敏捷运维峰会 广州站
3. 肖 博
vivo 通用存储研发组总监
职业经历
百度数据库团队
同程艺龙数据库团队
技术分享
vivo大规模Redis集群实践
基于 Redis Cluster 的灾备与同城双活实践
大规模多存储场景的数据库选型与服务平台建设之路
全球敏捷运维峰会 广州站
4. 目录
• 数据存储技术的本质
• 数据存储技术的现状
• 数据存储技术发展规划
全球敏捷运维峰会 广州站
5. 追本溯源
甲骨文
竹简
书本
存储介质:龟壳 存储介质:竹子 存储介质:纸张
特点:容量极小、读写效率低 特点:容量较小、读写效率较低 特点:容量较大,读写效率较高
磁盘
存储介质:磁介质 存储介质:NAND
特点:容量大,读写效率较高 特点:容量大,读写效率高
全球敏捷运维峰会 广州站
6. 数据存储的诉求
• 数据类型多
• 存储规模大
• 数据写入快
• 数据读取快
多 快
好 省
• 连续服务
• 数据安全
全球敏捷运维峰会 广州站
• 存储成本低
7. 数据存储的本质
数据存储
数据读取
存储规模
全球敏捷运维峰会 广州站
8. 目录
• 数据存储技术的本质
• 数据存储技术的现状
• 数据存储技术发展规划
全球敏捷运维峰会 广州站
9. 行业头部在做什么
⌾ 自研数据库/存储产品
⌾ 挑战金融场景
⌾ 选择部分或者全部开源
⌾ 弹性伸缩、存算分离等分布式特性
⌾ 智能优化、智能运维
⌾ 统一管控,HTPA多模等特性
⌾ 社区运营、生态建设、认证培训
全球敏捷运维峰会 广州站
10. 更敏捷
敏捷交付
对数据库以及存储服务而言,在软件研发过程中能够快速
的交付满足业务需要的存储服务和数据库
敏捷变更
对数据库以及存储服务而言,在服务运行和运维过程中的
各种变更能够足够的快捷,足够的轻量。
全球敏捷运维峰会 广州站
11. 更高的性能
用户体验
内容与场景同质化的情况下,各软件比拼的更多是用户体验,
而大多数软件或者应用都是围绕着数据展开的,存储服务与数
据库产品的性能显的尤为重要
公司收入
在广告服务、推荐场景、自然语言处理等场景中整体服务的性
能都会受到存储和数据库服务的性能影响
全球敏捷运维峰会 广州站
12. 更大规模
数据规模
移动互联网、工业互联网等产生大量的数据,各种IOT设备源源
不断的产生数据,参与数据生产加工的人群越来越多,数据规
模的不断增加,分布式架构已经成为常态
数据类型
结构化、半结构化、非结构化的数据类型以及AI、大数据等场
景对数据产生的需求,支撑各类数据存储的产品百花齐放
数据类型
数据分层表现明显,需要实时处理的数据占小部分,有大量的
冷数据需要处理,归档存储和冷存储的成本越来越高
全球敏捷运维峰会 广州站
13. 更低的存储成本
资源利用率
购买的服务器资源有没有被充分的利用,服务器的CPU、内存、
磁盘利用率如何,资源利用率的考核成为企业的常态,数据库
和存储服务的虚拟化、容器化、资源混合部署等技术逐渐成熟
成本量化
单个业务或者产品的ROI需要把用到的所有资源进行量化,对存
储和数据库服务同样需要,账单服务的诉求也越来越强烈
全球敏捷运维峰会 广州站
14. 更多的安全诉求
安全意识
全球数据泄露事件频发,敏感数据通过网络进行扩散进而产生
不良影响,用户目前对个人隐私数据保护的意识越来越强烈
合规要求
各个国家和区域密集出台数据安全的条例和法规,安全合规已
经影响到企业能否正常开展业务
全球敏捷运维峰会 广州站
15. 软硬结合
内核旁路
内核旁路在解决软件性能问题中越来越多的被使用,dpdk、
spdk等将技术日益成熟并被应用
专用硬件
专有的硬件设备从各个方面来提升软件性能,和硬件设备结合
能更大性能的提升软件性能,如AEP,DPU,智能网卡等等
全球敏捷运维峰会 广州站
16. 交叉融合
一体化
流批一体、湖仓一体、HTAP等可以减少数据流动、降低成本、
提升效率的方案和概念不断被挖掘和实现
多模存储
将多个系统组合使用的解决方案下沉为数据库内置能力,HTAP、
多模数据库等产品不断涌现
全球敏捷运维峰会 广州站
17. 智能
智能运维
基于已有的运维数据,通过机器学习的方式将运维动作智能化,
进一步解决因业务扩张,高人力成本难以维系的问题
智能优化
将AI技术应用于索引优化,智能索引推荐技术已经在某些数据
库产品中有落地,数据库参数智能优化也在不断探索
全球敏捷运维峰会 广州站
18. 目录
• 数据存储技术的本质
• 数据存储技术的现状
• 数据存储技术发展规划
全球敏捷运维峰会 广州站
19. 方法论
主见
新的概念和产品层出不穷,然而可能目前企业的现状还在使
用头部企业N年前的技术,容易产生焦虑感和沮丧感。但任
何新技术和产品都是为了解决某种场景的问题而诞生的,解
决当前企业面临的问题用适合的技术就行
重点
可靠性,可用性,安全,成本这些永远是重点,其中对于数
据库和存储而言前三点的重要程度是高于成本的,其次我们
大概投入20%的时间和人力能解决80%的问题,剩下的20%
问题要慎重评估后在确认是否投入
全球敏捷运维峰会 广州站
20. 方法论
系统思维
系统思维是一种从整体、全局出发看问题
的思维方式。
• 拆解,把系统问题拆解成各个元素
• 放大,把拆解后的元素放到整个系统里面来研究
• 控制,对每个元素单独控制
全球敏捷运维峰会 广州站
21. 警惕AIOPS的陷阱
AIOPS定义
AIOps是一种多层次的技术平台, 包括如下两点内容
•
使用机器学习来分析IT运营系统的各类业务与系统数据,从而实现
IT运营的自动化增强
•
能够实时的自动发现系统存在的问题且能自动实现故障自愈
AIOPS陷阱
• AIOPS ≠ AI + OPS
• 对现阶段AIOPS发展水平认知陷阱,AIOps目前正处于科技诞生的
促动期进入过高期望的峰值的发展时期,而对其抱有超越现阶段的
期望
•
技术选择上的陷阱,认为直接使用现成的深度学习或者机器学习算
法可以很好的做出决策
全球敏捷运维峰会 广州站
22. 数据库与存储平台规划
服务申请
服务下线
服务部署
Ø 混合云统一数据存储管理解决方案
Ø 数据存储DevOps解决方案
持续改进
体系闭环
数据恢复
服务维护
Ø 数据变更稳定性解决方案
产品支撑
Ø 数据安全解决方案
Ø 数据存储产品可用性解决方案
服务变更
数据变更
服务优化
全球敏捷运维峰会 广州站
23. 数据库与存储产品规划
Ø 丰富数据产品矩阵与生态
Ø 培养数据存储产品研发能力
Ø 降本增效的需求一直在
Ø 安全的需求变的越来越重要
Ø 兼顾业务需求与运维需求
全球敏捷运维峰会 广州站
24. 规划参考
数据存储管理服务平台
安全
成本
效率
可用性
数据备
份 服务监
控 服务巡
检 预案管
理 账户管
理 服务部
署 数据变
更 预算管
理 容量评
估 安全审
计 数据脱
敏
高可用 故障管
理 灾备管
理 数据校
验 运营报
表 数据查
询 服务变
更 资源分
账 容量预
测 数据防
火墙 权限管
控
故障自
愈 数据闪
回 从0恢复 服务熔
断 慢日志
管理 多环境
管理 自助化
服务 弹性扩
展 利用率
管理 数据治理 数据加
密
服务降
级 服务限
流 智能诊
断 数据校
验 数据订
阅 事件管
理 智能客
服 资源回
收 资产管
理 GDPR合规 日志分析
MySQL
RDS
DRDBMS ElasticSearch MongoDB
OLAP TSDB GDB
TIDB
KV Storage
NoSQL
RDBMS
通用存储服务
对象存储
Big Table
Table Store
块存储
文件存储
IDC资源
全球敏捷运维峰会 广州站
公有云资源
元
数
据
管
理
25. Thank You!
全球敏捷运维峰会 广州站