数据库软件架构设计些什么.docx

  1. 1、本文档共12页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据库软件架构设计些什么

数据库软件架构设计些什么今天主要分享58同城数据库软件架构上:如何保证数据可用性、如何提高数据库读性能、如何保证数据一致性和如何进行秒级扩容。作者:58沈剑|2016-11-29 08:50javascript:favorBox(open);?收藏 javascript:;?分享 一、基本概念二、数据库架构设计思路(1)可用性(2)读性能(3)一致性(4)扩展性一、基本概念概念一“单库”概念二“分片”分片解决的是“数据量太大”的问题,也就是通常说的“水平切分”。一旦引入分片,势必有“数据路由”的概念,哪个数据访问哪个库。路由规则通常有3种方法:(1)范围:range优点:简单,容易扩展缺点:各库压力不均(新号段更活跃)(2)哈希:hash优点:简单,数据均衡,负载均匀缺点:迁移麻烦(2库扩3库数据要迁移)(3)路由服务:router-config-server优点:灵活性强,业务与路由算法解耦缺点:每次访问数据库前多一次查询大部分互联网公司采用的方案二:哈希分库,哈希路由概念三“分组”分组解决“可用性”问题,分组通常通过主从复制的方式实现。互联网公司数据库实际软件架构是:又分片,又分组(如下图)二、数据库架构设计思路数据库软件架构师平时设计些什么东西呢?至少要考虑以下四点:(1)如何保证数据可用性(2)如何提高数据库读性能(大部分应用读多写少,读会先成为瓶颈)(3)如何保证一致性(4)如何提高扩展性2.1如何保证数据的可用性?解决可用性问题的思路是=冗余如何保证站点的可用性?复制站点,冗余站点如何保证服务的可用性?复制服务,冗余服务如何保证数据的可用性?复制数据,冗余数据数据的冗余,会带来一个副作用=引发一致性问题(先不说一致性问题,先说可用性)如何保证数据库“读”高可用?冗余读库冗余读库带来的副作用?读写有延时,可能不一致上面这个图是很多互联网公司mysql的架构,写仍然是单点,不能保证写高可用。如何保证数据库“写”高可用?冗余读库采用双主互备的方式,可以冗余写库带来的副作用?双写同步,数据可能冲突(例如“自增id”同步冲突),如何解决同步冲突,有两种常见解决方案:(1)两个写库使用不同的初始值,相同的步长来增加id:1写库的id为0,2,4,6...;2写库的id为1,3,5,7…(2)不使用数据的id,业务层自己生成唯一的id,保证数据不冲突58同城没有使用上述两种架构来做读写的“高可用”,58同城采用的是“双主当主从用”的方式:仍是双主,但只有一个主提供服务(读+写),另一个主是“shadow-master”,只用来保证高可用,平时不提供服务。master挂了,shadow-master顶上(vip漂移,对业务层透明,不需要人工介入)这种方式的好处:1)读写没有延时2)读写高可用不足:1)不能通过加从库的方式扩展读性能2)资源利用率为50%,一台冗余主没有提供服务那如何提高读性能呢?进入第二个话题,如何提供读性能。2.2如何扩展读性能?提高读性能的方式大致有三种,第一种是建立索引。这种方式不展开,要提到的一点是,不同的库可以建立不同的索引。写库不建立索引;线上读库建立线上访问索引,例如uid;线下读库建立线下访问索引,例如time;第二种扩充读性能的方式是,增加从库,这种方法大家用的比较多,但是,存在两个缺点:(1)从库越多,同步越慢(2)同步越慢,数据不一致窗口越大(不一致后面说,还是先说读性能的提高)58同城没有采用这种方法提高数据库读性能(没有从库),采用的是增加缓存。常见的缓存架构如下:上游是业务应用,下游是主库,从库(读写分离),缓存。58同城的玩法是:服务+数据库+缓存一套业务层不直接面向db和cache,服务层屏蔽了底层db、cache的复杂性。为什么要引入服务层,今天不展开,58采用了“服务+数据库+缓存一套”的方式提供数据访问,用cache提高读性能。不管采用主从的方式扩展读性能,还是缓存的方式扩展读性能,数据都要复制多份(主+从,db+cache),一定会引发一致性问题。2.3如何保证一致性?主从数据库的一致性,通常有两种解决方案:(1)中间件如果某一个key有写操作,在不一致时间窗口内,中间件会将这个key的读操作也路由到主库上。这个方案的缺点是,数据库中间件的门槛较高(百度,腾讯,阿里,360等一些公司有,当然58也有)(2)强制读主58的“双主当主从用”的架构,不存在主从不一致的问题。第二类不一致,是db与缓存间的不一致常见的缓存架构如上,此时写操作的顺序是:(1)淘汰cache(2)写数据库读操作的顺序是:(1)读cache,如果cache hit则返回(2)如果cache miss,则读从库(3)读从库后,将数据放回cache在一些异常时序情况下,有可能从【从库读到旧数据(同步还没有完成)

文档评论(0)

文档精品 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6203200221000001

1亿VIP精品文档

相关文档