SSD在新浪数据库平台优化实践

如果无法正常显示,请先停止浏览器的去广告插件。
分享至:
1. SSD在新浪数据库平台应用实践 杨尚刚 微博 @zolker
2. 自我简介  2011年加入新浪  负责新浪微博核心数据库架构设计和优化  负责新浪数据库平台底层软硬件平台优化  理念:设计简洁的架构
3. MySQL @ Sina  MySQL版本官方社区版  数据量PB级  每日承担访问量百亿级  2011年开始使用SSD,数量在万片级别  集群上千台  承担新浪微博核心数据持久化存储
4. 我们如何使用MySQL  读写分离  Master-Slave 复制  Sharding  多IDC容灾  完善的监控和容灾策略  良好的Schema设计
5. MySQL Replication  解决读性能问题  数据容灾  原生复制有明显的性能瓶颈
6. MySQL Sharding  Sharding is very complex, so itʼs best not to shard until itʼs obvious that you will actually need to!  不要轻易做Sharding
7. 后面会发生什么? 现实往往是很残酷的 预估的性能 实际的性能
8. 神马原因  服务峰值需求  服务SLA需求  TCO的需求 我们该如何解决呢  Scale UP VS Scale Out  继续Sharding
9. Scale UP VS Scale Out
10. 当时的现状 瓶颈 真得无解了吗? 答案当然是No 因为SSD
11. 必须知道的数字
12. SSD特点  使用电子元件实现数据的永久存储,没有机械组件  主要有基于DRAM和Flash两种  兼容目前HDD的接口  随机读写性能非常好  低延时,延时在微秒级
13. SSD有多快
14. HDD VS SSD
15. SSD关键技术  1.Read &Write  2. Flash translation layer  3. WL(Wear leveling)  4. Garbage collection & Trim  5. Over –provisioning &Write amplification  6. Bad block management & ECC
16. NAND Type SLC MLC TLC
17. PCIe VS SATA SSD 容量 4K随机读/写 每GB 带宽 延时 PCIe 1TB+ 70w+/20w+ 2-3$ 8GB/s 10-40 SATA <1TB 7w/2w 1-2$ 6Gb/s 50-100μs μs
18. NVMe is coming
19. 选择SSD  价格  容量  性能  可靠性 MTBF,UBER,TBW  稳定性  IO 延时  可维护性  功耗
20. 我们如何使用SSD  作为持久化存储,替换原有15K HDD  混合存储  在缓存场景作为扩展内存使用
21. SSD存储  主要是单机10块SATA SSD  硬Raid+Raid5  从库优先使用SSD,峰值写入高主库也会采用SSD  采用PCIe SSD 使用案例 12 3.5 10 3 2.5 8 2 6 1.5 4 1 2 0.5 0 0 服务器数 HDD SSD 99%响应时间(ms) HDD SSD
22. 针对SSD的IO 优化  echo noop/deadline >/sys/block/[device]/queue/scheduler  echo 0 >  echo2 > /sys/block/[device]/queue/rq_affinity(CentOS 6.4以上)  echo 0 > /sys/block/[device]/queue/add_random /sys/block/[device]/queue/rotational  文件系统关闭barrier  FastPath技术 CPU rq_affinity测试 IO调度算法测试
23. 针对SSD的MySQL优化  在5.5以上,提高innodb_write_io_threads和 innodb_read_io_threads  innodb_io_capacity需要调大  日志文件和redo放到机械硬盘,undo放到SSD  atomic write,不需要Double Write Buffer  InnoDB压缩  单机多实例+cgroup
24. 混合存储  Flashcache SSD作为读写的缓冲,数据最好有热点,对使用场景有要求 Facebook的Mohan开发,并且线上一直在用,最新版本3.0 法和读写效率做了优化 对淘汰算 微博核心数据库之前线上有使用  LSI Cachecade & Nytro MegaRaid 混合存储优点非常明显 热点集中下性能表现优异 节省成本 不过缺点也非常明显 运维成本高 对SSD寿命损害大 性能不稳定 cache的特性决定了它并不适合高并发OLTP Flashcache原理
25. 缓存存储  把内存和SSD虚拟成一个设备来使用,实现缓存数据的持久化  缓存容量突破单机内存的限制,减少后端的压力  降低成本  提高服务可用性
26. 面临的问题  SATA SSD做Raid后Raid卡性能瓶颈  SSD寿命监控和生命周期管理  SSD自动化测试,测试流程和指标的规范化  挖掘利用SSD性能
27. SSD In Future  12G Raid卡  No Raid,HBA卡直连  NVMe  使用TLC & 3D V-NAND, 打造全flash数据库平台  定制SSD  更低的成本,更大的容量,更高的性能
28. No Raid  现有Raid卡很容易成为SSD性能瓶颈  Raid有容量损失  SSD可靠性已经得到验证,上层应用有多级容错策略  Raid卡也可能出问题的
29. TLC在企业级应用  寿命如何  性能稳定性  故障率怎么样  能否取代高速机械硬盘,完成使命
30.
31. SSD 性能极限
32.
33. 联系方式 微博或微信搜索 zolker

Accueil - Wiki
Copyright © 2011-2024 iteam. Current version is 2.137.1. UTC+08:00, 2024-11-13 04:09
浙ICP备14020137号-1 $Carte des visiteurs$