《Redis设计与实现》阅读笔记1-数据结构与对象(字符串,链表,字典,跳跃表).docxVIP

《Redis设计与实现》阅读笔记1-数据结构与对象(字符串,链表,字典,跳跃表).docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
? ? 《Redis设计与实现》阅读笔记1-数据结构与对象(字符串,链表,字典,跳跃表) ? ? 一 数据结构与对象 1 简单动态字符串(SDS) Redis并未使用传统的C语言的字符串(以空字符结尾的字符数组),而是自己构建一种简单动态字符串(simple dynamic string)(SDS),SDS不仅被用于保存数据库中字符串值,SDS还被用于缓冲区:AOF模块中的AOF缓冲区,客服端的输入缓冲区。 1.1 SDS的定义 struct sdshdr{ //记录buf数组中已使用的字节的数量,等于SDS所保存字符串的长度 int len; //记录buf数组中未使用字节的数量 int free; //字节数组 char buf[]; } 注:SDS遵循C字符串以空字符结尾的惯例,字符串末尾有一个空字符,但空字符不记录在len里面,并且为空字符额外分配1字节的空间,这样做的好处就是SDS可以直接重用部分C字符串函数库中的函数。 1.2 SDS与C字符串 C字符串采用的在结尾以空字符结尾的简单表示方法不能满足Redis在安全与效率及功能上的要求。 1.2.1 常数复杂度获取字符串长度 传统的C字符串若要获取字符串的长度需要一次遍历,所以复杂度是O(N) SDS由于len属性的存在,获取长度的复杂度为O(1),设置与更新SDS长度的工作由SDS的API在执行时自动完成,无需手动修改。 1.2.2 杜绝缓冲区溢出 传统的C字符串会出现缓冲区溢出的现象,例如在使用strcat拼接字符串的时候,由于C字符串不会记录本身的长度,长度超长且未再次进行空间分配的情况下就会出现溢出的情况。 SDS的空间分配策略完全杜绝了缓冲区溢出的可能,当SDS的API对SDS进行修改时,会优先根据结构体中的属性来判断空间大小是否合适,若不够,会先进行拓展,再进行修改,所以不用担心溢出问题。 1.2.3 减少修改字符串带来的内存重分配次数 C字符串在增长和缩短一个字符串长度时总会对保存C字符串的数组进行一次内存重分配的操作: 如果是增长字符串,就会拓展底层数组的空间大小,不然就会引起缓冲区溢出 如果是缩短字符串,就会释放掉不用的那部分空间,不然就会引起内存泄漏 在一般的程序里面,如果修改字符串长度的情况不经常出现,那么每次修改都执行一次内存重分配是可以接受的,但Redis作为数据库,经常用于速度要求严格,数据被频繁修改的场合,如果每修改一次就进行一次内存重分配,就会对性能产生很大的影响。 为了避免上述的缺陷,SDS解除了字符串长度和底层数组长度的关联,buf数组的长度不一定是len+1,里面可包含未使用的字节,未使用字节的数量就有free来记录。通过这些方法,SDS实现了空间预分配和惰性空间释放两种优化策略。 空间预分配 当SDS字符串需要增长的时候,优先检查free剩余长度是否足够,若足够就直接增长,不够就进行空间拓展,进行空间扩展的时候,不仅会对其分配所需的空间,还会为SDS分配额外的未使用空间,此策略使得内存重分配次数从必定进行n次,到最多进行n次,分配策略如下。 若字符串拓展后len的长度小于1MB,那么free的大小将于len大小一样,例如len从5byte长度的字符串需要拓展到13byte大小,此时free的剩余长度不足以支撑拓展,进行内存重分配,len的大小变成13byte,free大小也为13byte,buf数组的实际长度就为13byte+13byte+1byte。 若字符串拓展后len的长度大于等于1MB,那么free的大小将于1MB,例如len从5MB长度的字符串需要拓展到10MB大小,此时free的剩余长度不足以支撑拓展,进行内存重分配,len的大小变成10MB,free大小就为1MB,buf数组的实际长度就为10MB+1MB+1byte。 惰性空间释放 当SDS字符串需要进行缩短操作时,并不会立即使用内存重分配来回收多余的字节,而且使用free属性将这些字节的数量记录下来,等待将来的使用。通过此操作避免了缩短字符串时进行的内存重分配,也优化了增长操作。 当然SDS也提供相依的API,在需要时真正的释放SDS的未使用空间,来避免惰性空间释放策略带来的内存浪费问题。 1.2.4 二进制安全 由于C字符串以ASCII编码,并以空字符结尾的特点,使得其只能存储文本数据, 不能存储图片,音频,视频等二进制文件。 而SDS保存文本或是二进制数据都是没有问题的,因为SDS使用len来判断结尾,而不是空字符,并且SDS的所有API都是二进制安全的,SDS的所有API都会以处理二进制的方式来处理SDS存放在buf数组中的数据。 1.2.5 兼容部分C字符串函数 由于SDS字符串保留了C字符串以空字符结尾的特点,所以SDS字

文档评论(0)

科技之佳文库 + 关注
官方认证
文档贡献者

科技赋能未来,创新改变生活!

版权声明书
用户编号:8131073104000017
认证主体重庆有云时代科技有限公司
IP属地浙江
统一社会信用代码/组织机构代码
9150010832176858X3

1亿VIP精品文档

相关文档