谈谈分库分表.docxVIP

下载本文档

4
0
约2.49千字
约 11页
2021-11-16 发布于湖南
举报
版权申诉

谈谈分库分表.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

谈谈分库分表第一种：磁盘读IO瓶颈，热点数据太多，数据库缓存放不下，每次查询时会产生大量的IO，降低查询速度 -?分库和垂直分表。其次种：网络IO瓶颈，恳求的数据太多，网络带宽不够 -?分库。 2、CPU瓶颈第一种：SQL问题，如SQL中包含join，group by，order by，非索引字段条件查询等，添加CPU运算的操作 - SQL优化，建立合适的索引，在业务Service层进行业务计算。其次种：单表数据量太大，查询时扫描的行太多，SQL效率低，CPU领先消灭瓶颈 -?水平分表。二、分库分表 1、水平分库 1、概念：以字段为依据，依据肯定策略（hash、range等），将一个库中的数据拆分到多个库中。 2、结果： ·? 每个库的结构都一样； ·? 每个库的数据都不一样，没有交集； ·? 全部库的并集是全量数据； 3、场景：系统确定并发量上来了，分表难以根本上处理问题，并且还没有明显的业务归属来垂直分库。 4、分析：库多了，io和cpu的压力自然可以成倍缓解。 2、水平分表 1、概念：以字段为依据，依据肯定策略（hash、range等），将一个表中的数据拆分到多个表中。 2、结果： ·??每个表的结构都一样； ·??每个表的数据都不一样，没有交集； ·??全部表的并集是全量数据； 3、场景：系统确定并发量并没有上来，只是单表的数据量太多，影响了SQL效率，加重了CPU负担，以至于成为瓶颈。 4、分析：表的数据量少了，单次SQL执行效率高，自然减轻了CPU的负担。 3、垂直分库 1、概念：以表为依据，依据业务归属不同，将不同的表拆分到不同的库中。 2、结果： ·??每个库的结构都不一样； ·??每个库的数据也不一样，没有交集； ·??全部库的并集是全量数据； 3、场景：系统确定并发量上来了，并且可以笼统出单独的业务模块。 4、分析：到这一步，基本上就可以服务化了。例如，随着业务的进展一些公用的配置表、字典表等越来越多，这时可以将这些表拆到单独的库中，甚至可以服务化。再有，随着业务的进展孵化出了一套业务模式，这时可以将相关的表拆到单独的库中，甚至可以服务化。 4、垂直分表 1、概念：以字段为依据，依据字段的活跃性，将表中字段拆到不同的表（主表和扩展表）中。 2、结果： ·??每个表的结构都不一样； ·??每个表的数据也不一样，一般来说，每个表的字段至少有一列交集，一般是主键，用于关联? ? ? ?数据； ·??全部表的并集是全量数据； 3、场景：系统确定并发量并没有上来，表的记录并不多，但是字段多，并且热点数据和非热点数据在一起，单行数据所需的存储空间较大。以至于数据库缓存的数据行削减，查询时会去读磁盘数据产生大量的随机读IO，产生IO瓶颈。 4、分析：可以用列表页和详情页来挂念理解。垂直分表的拆分准绳是将热点数据（可能会冗余经常一起查询的数据）放在一起作为主表，非热点数据放在一起作为扩展表。这样更多的热点数据就能被缓存下来，进而削减了随机读IO。拆了之后，要想获得全部数据就需要关联两个表来取数据。但记住，千万别用join，由于join不只会添加CPU负担并且会讲两个表耦合在一起（必需在一个数据库实例上）。关联数据，应当在业务Service层做文章，分别猎取主表和扩展表数据然后用关联字段关联得到全部数据。三、分库分表工具 1、sharding-sphere：jar，前身是sharding-jdbc； 2、TDDL：jar，Taobao Distribute Data Layer； 3、Mycat：两头件。注：工具的利弊，请自行调研，官网和社区优先。四、分库分表步骤依据容量（当前容量和增长量）评估分库或分表个数 - 选key（均匀）- 分表规章（hash或range等）- 执行（一般双写）- 扩容问题（尽量削减数据的移动）。五、分库分表问题 1、非partition key的查询问题（水平分库分表，拆分策略为常用的hash法） 1、端上除了partition key只要一个非partition key作为条件查询 ·??映射法 ·??基因法注：写入时，基因法生成user_id，如图。关于xbit基因，例如要分8张表，23=8，故x取3，即3bit基因。依据user_id查询时可直接取模路由到对应的分库或分表。依据user_name查询时，先通过user_name_code生成函数生成user_name_code再对其取模路由到对应的分库或分表。id生成常用snowflake算法。 2、端上除了partition key不止一个非partition key作为条件查询 ·??映射法 ·??冗余法注：依据order_id或buyer_id查询时路由到db_o_buyer库中，依据seller_id查询时路由