Linux操作系统线程库性能测试和分析.docVIP

下载本文档

4
0
约 9页
2016-09-27 发布于安徽
举报
版权申诉

Linux操作系统线程库性能测试和分析.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

安博测试空间技术中心/地址：北京市海淀区学院路40号大唐电信测试空间楼联系电话：010-623032236230326062303230Linux操作系统线程库性能测试与分析NPTL成为glibc正选线程库后，它的性能如何受到很多人的关注。本文就针对NPTL与LinuxThreads的性能比较，以及超线程、内核可抢占等特性对线程性能的影响进行了全面评测。一、前言在Linux2.6.x内核中，调度性能的改进是其中最引人注目的一部分[1]。NPTL（NativePosixThreadLibrary）[2]使用内核的新特性重写了Linux的线程库，取代历史悠久而备受争议的LinuxThreads[3]成为glibc的首选线程库。NPTL的性能究竟如何？相对LinuxThreads又有哪些明显的改进？在对NPTL进行全面分析之前，本文针对这两种线程库，以及内核中内核可抢占（Preemptible）和超线程（HyperThreading）[4]等特性进行了全面的性能评测，结果表明NPTL绝对值得广大服务器系统期待和使用。二、Benchmark1.测试平台进行本测试的硬件平台为浪潮NF420R服务器[7]，4个Hyperthreading-enabledIntelXeon2.2G处理器，4G内存。Linux选择了Slackware9.0发行版[8]，所使用的内核源码来自。2.针对测试：LMBenchlmbench是一个用于评价系统综合性能的多平台开源benchmark[5]，但其中没有对线程的支持。其中有两个测试进程性能的benchmark：lat_proc用于评测进程创建和终止的性能，lat_ctx用于评测进程切换的开销。lmbench拥有良好的benchmark结构，只需要修改具体的Target程序（如lat_proc.c和lat_ctx.c），就可以借用lmbench的计时、统计系统得到我们关心的线程库性能的数据。基于lat_proc和lat_ctx的算法，本文实现了lat_thread和lat_thread_ctx两个benchmark。在lat_thread中，lat_proc被改造成使用线程，用pthread_create()替代了fork()，用pthread_join()替代wait()；在lat_thread_ctx中，沿用lat_ctx的评测算法（见lat_ctx手册页），将创建进程的过程改写为创建线程，仍然使用管道进行通信和同步。lat_threadnullnull参数表示线程不进行任何实际操作，创建后即刻返回。lat_thread_ctx-s#threadssize参数与lat_ctx定义相同，可表示线程的大小（实际编程时为分配K数据；#threads参数为线程数，即参与令牌传递的线程总数，相当于程序负载情况。3.综合测试：Volanomarkvolanomark是一个纯java的benchmark，专门用于测试系统调度器和线程环境的综合性能[6]，它建立一个模拟Client/Server方式的Java聊天室，通过获取每秒平均发送的消息数来评测宿主机综合性能（数值越大性能越好）。Volanomark测试与Java虚拟机平台相关，本文使用SunJavaSDK1.4.2作为测试用Java平台，Volanomark版本。三、测试结果测试计划中将内核分为2.4.26、2.6.6/支持内核抢占和2.6.6/不支持内核抢占三类；通过配置内核以及NF420R的BIOS实现三类SMP规模：单处理机(UP)、4CPU的SMP（SMP4）和打开超线程支持的虚拟8CPUSMP（SMP8*）。内核配置和SMP规模的每一种组合都针对LinuxThreads和NPTL使用lat_thread、lat_thread_ctx和volanomark获取一组数据。由于NPTL无法在2.4.x内核上使用，该项数据空缺。四、结果分析1.LinuxThreadsvsNPTL：线程创建/销毁开销使用2.6.6/preemptible内核配置下UP和SMP4的测试数据获得下图：图1在线程创建/销毁开销方面，NPTL的改进相当明显（降低约600%）。实际上，NPTL不再像LinuxThreads那样需要使用用户级的管理线程来维护线程的创建和销毁[9]，因此，很容易理解它在这方面的开销能够大幅度降低。同时，由图可见，单CPU下创建线程总是比多CPU下迅速。2.LinuxThreadsvsNPTL：线程切换开销同样使用2.6.6/preemptible内核配置下UP和SMP4的数据：图2随着lat_thread_ctx的参与线程增多，不管是哪个线程库，单处理机条件下的线程切换开销都陡峭上升，而SMP条件下则上升比较平缓。在这方面，LinuxThreads和NPTL表