- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
?
?
《Redis设计与实现》阅读笔记1-数据结构与对象(字符串,链表,字典,跳跃表)
?
?
一 数据结构与对象
1 简单动态字符串(SDS)
Redis并未使用传统的C语言的字符串(以空字符结尾的字符数组),而是自己构建一种简单动态字符串(simple dynamic string)(SDS),SDS不仅被用于保存数据库中字符串值,SDS还被用于缓冲区:AOF模块中的AOF缓冲区,客服端的输入缓冲区。
1.1 SDS的定义
struct sdshdr{
//记录buf数组中已使用的字节的数量,等于SDS所保存字符串的长度
int len;
//记录buf数组中未使用字节的数量
int free;
//字节数组
char buf[];
}
注:SDS遵循C字符串以空字符结尾的惯例,字符串末尾有一个空字符,但空字符不记录在len里面,并且为空字符额外分配1字节的空间,这样做的好处就是SDS可以直接重用部分C字符串函数库中的函数。
1.2 SDS与C字符串
C字符串采用的在结尾以空字符结尾的简单表示方法不能满足Redis在安全与效率及功能上的要求。
1.2.1 常数复杂度获取字符串长度
传统的C字符串若要获取字符串的长度需要一次遍历,所以复杂度是O(N)
SDS由于len属性的存在,获取长度的复杂度为O(1),设置与更新SDS长度的工作由SDS的API在执行时自动完成,无需手动修改。
1.2.2 杜绝缓冲区溢出
传统的C字符串会出现缓冲区溢出的现象,例如在使用strcat拼接字符串的时候,由于C字符串不会记录本身的长度,长度超长且未再次进行空间分配的情况下就会出现溢出的情况。
SDS的空间分配策略完全杜绝了缓冲区溢出的可能,当SDS的API对SDS进行修改时,会优先根据结构体中的属性来判断空间大小是否合适,若不够,会先进行拓展,再进行修改,所以不用担心溢出问题。
1.2.3 减少修改字符串带来的内存重分配次数
C字符串在增长和缩短一个字符串长度时总会对保存C字符串的数组进行一次内存重分配的操作:
如果是增长字符串,就会拓展底层数组的空间大小,不然就会引起缓冲区溢出
如果是缩短字符串,就会释放掉不用的那部分空间,不然就会引起内存泄漏
在一般的程序里面,如果修改字符串长度的情况不经常出现,那么每次修改都执行一次内存重分配是可以接受的,但Redis作为数据库,经常用于速度要求严格,数据被频繁修改的场合,如果每修改一次就进行一次内存重分配,就会对性能产生很大的影响。
为了避免上述的缺陷,SDS解除了字符串长度和底层数组长度的关联,buf数组的长度不一定是len+1,里面可包含未使用的字节,未使用字节的数量就有free来记录。通过这些方法,SDS实现了空间预分配和惰性空间释放两种优化策略。
空间预分配当SDS字符串需要增长的时候,优先检查free剩余长度是否足够,若足够就直接增长,不够就进行空间拓展,进行空间扩展的时候,不仅会对其分配所需的空间,还会为SDS分配额外的未使用空间,此策略使得内存重分配次数从必定进行n次,到最多进行n次,分配策略如下。
若字符串拓展后len的长度小于1MB,那么free的大小将于len大小一样,例如len从5byte长度的字符串需要拓展到13byte大小,此时free的剩余长度不足以支撑拓展,进行内存重分配,len的大小变成13byte,free大小也为13byte,buf数组的实际长度就为13byte+13byte+1byte。
若字符串拓展后len的长度大于等于1MB,那么free的大小将于1MB,例如len从5MB长度的字符串需要拓展到10MB大小,此时free的剩余长度不足以支撑拓展,进行内存重分配,len的大小变成10MB,free大小就为1MB,buf数组的实际长度就为10MB+1MB+1byte。
惰性空间释放
当SDS字符串需要进行缩短操作时,并不会立即使用内存重分配来回收多余的字节,而且使用free属性将这些字节的数量记录下来,等待将来的使用。通过此操作避免了缩短字符串时进行的内存重分配,也优化了增长操作。
当然SDS也提供相依的API,在需要时真正的释放SDS的未使用空间,来避免惰性空间释放策略带来的内存浪费问题。
1.2.4 二进制安全
由于C字符串以ASCII编码,并以空字符结尾的特点,使得其只能存储文本数据,不能存储图片,音频,视频等二进制文件。
而SDS保存文本或是二进制数据都是没有问题的,因为SDS使用len来判断结尾,而不是空字符,并且SDS的所有API都是二进制安全的,SDS的所有API都会以处理二进制的方式来处理SDS存放在buf数组中的数据。
1.2.5 兼容部分C字符串函数
由于SDS字符串保留了C字符串以空字符结尾的特点,所以SDS字
您可能关注的文档
- [C语言学习]C语言程序设计基础-第1篇.docx
- [UWP]浅谈按钮设计.docx
- ‘高并发系统设计详解.docx
- 《C语言程序设计》第3章-分支结构-第2篇.docx
- 《Linux内核设计与实现》-读书笔记.docx
- 《Linux内核设计与实现》第一章Linux内核简介.docx
- 《Linux内核设计与实现》第七、八章中断处理.docx
- 《Linux内核设计与实现》第三章进程管理.docx
- 《Linux内核设计与实现》第九、十章内核同步.docx
- 《Linux内核设计与实现》第五章系统调用.docx
- 《Redis设计与实现》阅读笔记10-复制.docx
- 《Redis设计与实现》阅读笔记11-Sentinel.docx
- 《Redis设计与实现》阅读笔记12-集群.docx
- 《Redis设计与实现》阅读笔记2-数据结构与对象(整数集合,压缩列表).docx
- 《Redis设计与实现》阅读笔记3-数据结构与对象(对象).docx
- 《Redis设计与实现》阅读笔记4-数据库.docx
- 《Redis设计与实现》阅读笔记5-RDB持久化.docx
- 《Redis设计与实现》阅读笔记6-AOF持久化.docx
- 《Redis设计与实现》阅读笔记7-事件.docx
- 《Redis设计与实现》阅读笔记8-客户端.docx
文档评论(0)