- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
;今年年初,WM删库事件
去年年初,云故障
自建IDC,机架故障
不小心drop错表,不小心delete错数据
不小心删除了根目录
被拖库;这些问题,要不要解决?;技术体系建设,主要矛盾寻找思路
删库黑天鹅,快狗打车最佳实践
总结;作为技术负责人,是否有这样的纠结?;作为架构部负责人,如何规划内部研发框架,组件,技术平台?
作为质量部负责人,如何规划质量体系建设重点?
作为运维部负责人,如何规划运维体系建设的重点?
作为DBA负责人,如何规划数据库体系建设的重点?
…;服务器初始化自动化
RDS申请工单自动化
域名申请工单自动化
站点与服务发布自动化
服务器资源监控,站点与服务进程端口监控,数据库连接监控
二进制与配置备份自动化
…;原则一:优先做“最高频,最耗时,效率提升最大”的事情;服务器初始化自动化
RDS申请工单自动化
域名申请工单自动化
站点与服务发布自动化
服务器资源监控,站点与服务进程端口监控,数据库连接监控
二进制与配置备份自动化
…;那如果是这样,黑天鹅事件发生概率低,岂不是永远轮不上?;原则二:优先做“一旦发生,后果无法接受”的事情;数据安全性无法保障,一旦发生,对公司来说是及其灾难性的!;问题转化为,如何保证数据安全性?;主从
主主
潜在问题
- 无法防止无意误删;全量备份:定期库文件物理备份
增量备份:定期binlog物理备份
如果误删,如何恢复?
潜在问题
- 恢复周期较长;一小时延时从库
如果误删,如何恢复?
潜在问题
- 万一延时从刚连上,误删了呢?;双一小时延时从库
如果误删,如何恢复?
潜在问题
- 资源利用率较低;允许延时的只读场景使用延时从
潜在问题
1个小时故障都没发现怎么办?
云故障所有备份都丢了怎么办?
内部恶意怎么办?;个小时故障都没发现怎么办?
监控完善(一个小时数据全没了都没发现?太业余了吧?)
云故障所有备份都丢了怎么办?
异地备份(可以把数据拷贝到多个机房,或者内网备份机器)
内部恶意怎么办?
权限隔离(不能一个人干所有事:删实时库,删延时库,删增量+全量,删异地,删内网);强调一点:定期演练;删库的恢复,是技术难题吗?;重视,比怎么做更重要!;快狗打车,数据安全实践:
线上高可用
定期全量+增量备份:防止误删
一小时延时从:加速恢复
双一小时延时从:无时间死角
只读场景使用延时从:提高利用率
完善监控:及时发现
异地备份(多机房,内网):防止云故障
权限隔离:避免内部恶意;
原创力文档


文档评论(0)