程序在内存中运行的奥秘.docVIP

下载本文档

6
0
约3.47千字
约 5页
2016-08-25 发布于重庆
举报
版权申诉

程序在内存中运行的奥秘.doc

1、本文档共5页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

程序在内存中运行的奥秘

内存管理是操作系统的核心功能，无论对于开发者还是系统管理员内存管理的重要性都是不言而喻的。我会在接下来的几篇文章通过计算机的实际运行过程谈谈内存管理，当然在必要的时候我也会从底层原理去阐释这个问题。我们提到的概念是不局限于平台特性的通用概念，不过为了阐述这些概念我们选取的实例大多来源于Linux和基于x86架构的32位Windows操作系统。这篇文章，我们首先来看看程序是如何使用内存的。多任务操作系统中，每一个进程都有它自己的内存“沙盒”。所谓“沙盒”，是指虚拟地址空间，在32位模式下，虚拟地址空间最多能表示4GB容量。通过页表机制，虚拟地址空间能够映射到物理内存。页表由操作系统内核来管理，并可被处理器访问。每个进程有着属于自己的页表，不过进程也不能随心所欲。因为虚拟地址一旦投入使用，所有在计算机中运行的软件都会占用虚拟地址空间，包括操作系统内核自身。也就是说，操作系统内核将保留一部分虚拟地址空间。 ???????????????????????? 这并不意味着系统内核能够肆无忌惮的使用物理内存，系统内核只能使用其管辖的虚拟地址空间所对应的物理内存。系统内核所使用的内存空间通过特权码（privileged code，2级或者更低）来标记，以防止用户模式的程序访问到内核空间而发生页面错误。在Linux中，内核始终占用着一定空间，并且每个内核进程映射的物理内存地址是固定的。因此，内核代码与数据在内存中的地址总是能够被准确定位，从而为时刻处理中断以及系统调用做好了准备。与此相反，只要用户进程状态发生变化，其映射的地址空间也随即改变。图中蓝色区域表示虚拟地址中映射到物理内存的部分，白色区域则是未映射。在这个例子中，Firefox惊人的内存需求让它使用的虚拟地址远远超过了其自身的地址空间。内存地址空间是由诸如堆、栈等段式内存管理方式进行管理的。需要指出的是，这里段的概念只不过是表示了一段内存地址，它和Intel段表机制（Intel-style segments）没有任何关系。总的来说，我们在这里讨论的是Linux系统进程标准的段式内存管理方法。如果运行过程轻松愉快、准确无误，那么上图显示的段式虚拟地址管理启用过程对于计算机内几乎所有进程都完全一致。而这种机制为远程攻击带来了安全隐患。远程攻击往往需要参考绝对内存地址：诸如栈地址、库函数地址等等。而远程攻击者们知道了这些地址空间是固定的，他们闭着眼睛都能找到他们需要的位置。倘若真的如此，那么人们毫无疑问就会被黑客攻击了。正因为如此，随即地址空间已经成为流行的内存地址管理方式。Linux随机为栈（stack）、内存映射段（memorymapping segment）以及堆（heap?）的起始地址添加偏移量。不幸的是，32位地址空间非常吃紧，限制了随机分配地址的范围和效率（hamperingits effectiveness）。进程地址空间的首段地址便是栈，它储存了局部变量以及大多数编程语言的函数参数。当调用方法或者函数时，会有一个新的元素进栈。一旦函数返回了值，那么该元素就会被销毁。这种简单的设计，很有可能是考虑到数据操作都符合后进先出（LIFO?）规则，这意味着访问栈的内容并不需要复杂的数据结构，一个简单的栈顶指针就能搞定一切。进栈和出栈的操作方便快捷，不需要过多判断。另外，栈的反复使用能够使栈主流在CPU缓存（cpu caches）中，从而加快数据存取。每个进程中的每个线程都有属于自己的栈。如果映射的栈地址空间被压入了超过栈容量的数据，那么栈便无法继续工作了。这种情况会导致一个由expand_stack(),函数处理的页面错误，这个函数会调用acct_stack_growth()?函数去检查是否应该为这个栈增加容量。如果这个栈的容量低于RLIMIT_STACK?(通常为?8MB)限定的值，那么栈的容量会正常增加，程序也会继续正常运行，并且程序不会知道刚刚发生了什么。当然，这是根据实际需要来调整栈大小的一般机制，如果栈的容量达到了最大值上限，那么栈就会溢出，程序也会收到一个段出错的信息。虽然在程序需要的时候映射的栈空间会增加，但是栈使用的空间减少时，栈却不会释放多于的空间。这就好像联邦政府预算，只可能越来越多。程序存取上图所示的未映射区域，是唯一正常实现动态增加栈空间的情况，程序访问其他未映射内存访问将会出现页面错误最终导致段错误。有些映射区域是只读的，程序试图写入这些区域同样会导致这种错误。说到堆，我们就不得不提它的内存使用机制。堆支持运行时内存分配，和栈不同，大多数语言都允许程序使用堆管理内存。满足内存需求是语言运行时和C语言核心间的联结点，而堆的内存管理接口是通过malloc()及其友元函数来实现的，在C#这样支持垃圾回收机制的语言中，其接口是新定义的关键字