- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
分表处理设计思想和实现
分表处理设计思想和实现
一、概述
分表是个目前算是比较炒的比较流行的概念,特别是在大负载的情况下,分表是一个良好分
散数据库压力的好方法。
首先要了解为什么要分表,分表的好处是什么。我们先来大概了解以下一个数据库执行SQL
的过程:
接收到SQL-- 放入SQL执行队列 -- 使用分析器分解SQL-- 按照分析结果进行数
据的提取或者修改 -- 返回处理结果
当然,这个流程图不一定正确,这只是我自己主观意识上这么我认为。那么这个处理过程当
中,最容易出现问题的是什么?就是说,如果前一个SQL没有执行完毕的话,后面的SQL
是不会执行的,因为为了保证数据的完整性,必须对数据表文件进行锁定,包括共享锁和独
享锁两种锁定。共享锁是在锁定的期间,其它线程也可以访问这个数据文件,但是不允许修
改操作,相应的,独享锁就是整个文件就是归一个线程所有,其它线程无法访问这个数据文
件。一般MySQL中最快的存储引擎MyISAM,它是基于表锁定的,就是说如果一锁定的
话,那么整个数据文件外部都无法访问,必须等前一个操作完成后,才能接收下一个操作,
那么在这个前一个操作没有执行完成,后一个操作等待在队列里无法执行的情况叫做阻塞,
一般我们通俗意义上叫做“锁表”。
锁表直接导致的后果是什么?就是大量的SQL无法立即执行,必须等队列前面的SQL全部
执行完毕才能继续执行。这个无法执行的SQL就会导致没有结果,或者延迟严重,影响用
户体验。
特别是对于一些使用比较频繁的表,比如SNS系统中的用户信息表、论坛系统中的帖子表
等等,都是访问量大很大的表,为了保证数据的快速提取返回给用户,必须使用一些处理方
式来解决这个问题,这个就是我今天要聊到的分表技术。
分表技术顾名思义,就是把若干个存储相同类型数据的表分成几个表分表存储,在提取数据
的时候,不同的用户访问不同的表,互不冲突,减少锁表的几率。比如,目前保存用户分表
有两个表,一个是user_1表,还有一个是 user_2 表,两个表保存了不同的用户信息,
user_1 保存了前10万的用户信息,user_2保存了后10万名用户的信息,现在如果同时查
询用户 heiyeluren1 和 heiyeluren2 这个两个用户,那么就是分表从不同的表提取出
来,减少锁表的可能。
我下面要讲述的两种分表方法我自己都没有实验过,不保证准确能用,只是提供一个设计思
路。下面关于分表的例子我假设是在一个贴吧系统的基础上来进行处理和构建的。(如果没
有用过贴吧的用户赶紧Google一下)
二、基于基础表的分表处理
这个基于基础表的分表处理方式大致的思想就是:一个主要表,保存了所有的基本信息,如
果某个项目需要找到它所存储的表,那么必须从这个基础表中查找出对应的表名等项目,好
直接访问这个表。如果觉得这个基础表速度不够快,可以完全把整个基础表保存在缓存或者
内存中,方便有效的查询。
我们基于贴吧的情况,构建假设如下的3张表:
1. 贴吧版块表: 保存贴吧中版块的信息
2. 贴吧主题表:保存贴吧中版块中的主题信息,用于浏览
3. 贴吧回复表:保存主题的原始内容和回复内容
“贴吧版块表”包含如下字段:
版块ID board_id int(10)
版块名称 board_name char(50)
子表ID table_id smallint(5)
产生时间 created datetime
“贴吧主题表”包含如下字段:
主题ID topic_id int(10)
主题名称 topic_name char(255)
版块ID board_id int(10)
创建时间 created datetime
“贴吧回复表”的字段如下:
回复ID reply_id int(10)
回复内容 reply_text text
主题ID topic_id int(10)
版块ID board_id int(10)
创建时间 created datetime
那么上面保存了我们整个贴吧中的表结构信息,三个表对应的关系是:
版块 -- 多个主题
主题 -- 多个回复
您可能关注的文档
最近下载
- 2024首届全国红旗杯班组长大赛题库及答案(2)(2001-4000题).docx VIP
- 河南省漯河市郾城区2023-2024学年八年级上学期期末数学试题(含答案).doc
- 软件资格考试信息系统管理工程师(基础知识、应用技术)合卷(中级)试题与参考答案.docx VIP
- 东南大学《信号与系统》期末试卷及习题集合集_wrapper.pdf
- 2025年软件资格考试信息系统管理工程师(中级)(基础知识、应用技术)合卷试题及解答参考.docx VIP
- 南京邮电大学2021学年度第一学期《概率论与数理统计》期末考试试卷(A卷)及参考答案.docx
- 2024年上海市中考数学试题(含答案).docx VIP
- 信息系统管理工程师(基础知识、应用技术)合卷软件资格考试(中级)试题与参考答案(2025年).docx VIP
- 员工心态培训态度与能力积极的工作态度课件PPT.pptx VIP
- 王艳艳《工程招投标与合同管理》3第三章 工程项目投标2014.ppt VIP
文档评论(0)