- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
Linux操作系统线程库性能测试与分析
NPTL成为glibc正选线程库后,它的性能如何受到很多人的关注。本文就针对NPTL与LinuxThreads的性能比较,以及超线程、内核可抢占等特性对线程性能的影响进行了全面评测。
一、前言
在Linux2.6.x内核中,调度性能的改进是其中最引人注目的一部分[1]。NPTL(NativePosixThreadLibrary)[2]使用内核的新特性重写了Linux的线程库,取代历史悠久而备受争议的LinuxThreads[3]成为glibc的首选线程库。
NPTL的性能究竟如何?相对LinuxThreads又有哪些明显的改进?在对NPTL
进行全面分析之前,本文针对这两种线程库,以及内核中内核可抢占
(Preemptible)和超线程(HyperThreading)[4]等特性进行了全面的性能评测,结果表明NPTL绝对值得广大服务器系统期待和使用。
二、Benchmark
测试平台
进行本测试的硬件平台为浪潮NF420R服务器[7],4个Hyperthreading-enabledIntelXeon2.2G处理器,4G内存。Linux选择了Slackware9.0发行版[8],所使用的内核源码来自。
针对测试:LMBench
lmbench是一个用于评价系统综合性能的多平台开源benchmark[5],但其中没有对线程的支持。其中有两个测试进程性能的benchmark:lat_proc用于评测进程创建和终止的性能,lat_ctx用于评测进程切换的开销。lmbench拥有良好的
benchmark结构,只需要修改具体的Target程序(如lat_proc.c和lat_ctx.c),就可以借用lmbench的计时、统计系统得到我们关心的线程库性能的数据。
基于lat_proc和lat_ctx的算法,本文实现了lat_thread和lat_thread_ctx两个
benchmark。在lat_thread中,lat_proc被改造成使用线程,用pthread_create()替代了fork(),用pthread_join()替代wait();在lat_thread_ctx中,沿用lat_ctx的评测算法(见lat_ctx手册页),将创建进程的过程改写为创建线程,仍然使用管道进行通信和同步。
lat_threadnull
lat_threadnull
null参数表示线程不进行任何实际操作,创建后即刻返回。
lat_thread_ctx-s#threads
lat_thread_ctx-s#threads
size参数与lat_ctx定义相同,可表示线程的大小(实际编程时为分配K数据;
#threads参数为线程数,即参与令牌传递的线程总数,相当于程序负载情况。
综合测试:Volanomark
volanomark是一个纯java的benchmark,专门用于测试系统调度器和线程环境的综合性能[6],它建立一个模拟Client/Server方式的Java聊天室,通过获取每秒平均发送的消息数来评测宿主机综合性能(数值越大性能越好)。Volanomark测试与Java虚拟机平台相关,本文使用SunJavaSDK1.4.2作为测试用Java平台,
Volanomark版本。
三、测试结果
测试计划中将内核分为2.4.26、2.6.6/支持内核抢占和2.6.6/不支持内核抢占三类;通过配置内核以及NF420R的BIOS实现三类SMP规模:单处理机(UP)、
4CPU的SMP(SMP4)和打开超线程支持的虚拟8CPUSMP(SMP8*)。内核配置和SMP规模的每一种组合都针对LinuxThreads和NPTL使用
lat_thread、lat_thread_ctx和volanomark获取一组数据。由于NPTL无法在2.4.x内核上使用,该项数据空缺。
四、结果分析
LinuxThreadsvsNPTL:线程创建/销毁开销
使用2.6.6/preemptible内核配置下UP和SMP4的测试数据获得下图:
图1
在线程创建/销毁开销方面,NPTL的改进相当明显(降低约600%)。实际上,NPTL不再像LinuxThreads那样需要使用用户级的管理线程来维护线程的创建和销毁[9],因此,很容易理解它在这方面的开销能够大幅度降低
您可能关注的文档
最近下载
- 2025年广东大湾区高三一模高考物理试卷试题(含答案详解).docx
- 22412 +《基础写作》国开大学.docx VIP
- 国开《高等数学基础》形考任务1-4答案.pdf VIP
- 2025年陕西省初中学业水平考试地理试卷真题(含答案详解).pdf VIP
- 自来水管道保护专项施工方案.docx VIP
- 临床基因扩增检验实验室质量手册.docx VIP
- 超全面新课标高考英语备考:1冠代介词、2名词和主谓一致、3形容词和副词、4时态和语态、5非谓语动词、6从句、7 特殊句式、8 听力场景核心词汇、9 完形填空高频词汇(复习思维导图+必备知识手册).doc VIP
- E+H仪表选型手册 80E、83E科氏力质量流量测量系统 质量流量计 TI28103D.pdf
- 无线调车机车信号和监控系统(STP ).pdf VIP
- 2025年度心脏重症监护室工作总结及2026年工作计划.docx
原创力文档


文档评论(0)