- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
手动百分位数:无需软件即可计算关键统计数据
本文介绍了如何手动分步计算百分位数,这是一种了解数据的有用统计方法。不需要软件或编码技能:您只需要一张纸、一支笔、一个计算器,并愿意做一些简单的数学计算!
什么是百分位数?
百分位数是统计学的核心工具。它们有助于了解数据集中的数据点如何在值范围方面进行比较。与百分比的概念密切相关,百分位数告诉我们数据集中的值,低于该值的实例的确定百分比。例如,学生群体数值考试成绩数据集中的第50个百分位告诉我们一个“阈值”,该群体中有50%的学生低于该阈值。具体来说,如果第50个百分位数为65(满分100),则意味着一半学生的分数低于65。很简单,不是吗?
平均值或中位数为我们提供了以不同方式解释的数据“中心”的指标,而百分位数则更进一步,使我们能够识别数据特定部分的特定点所在的位置。事实上,中位数只不过是第50个百分位数(参见上面的示例),但百分位数可以让您了解整个值范围内数据点的更详细和具体的位置。
除了中位数之外,两种更常用的百分位数类型是:
十分位数:将数据集分为十个相等的部分,每个部分代表数据的10%。该图通过直方图说明了数据集中十个十分位数的位置:百分位数由垂直虚线表示。
?
?
四分位数:将数据集分为四个相等的部分,每个部分代表数据的25%。箱线图是一种特殊类型的显示四分位数的可视化方法(蓝色虚线表示第一、第二和第三四分位数所在的位置):
逐步百分位计算
让我们按照这四个简单的步骤来计算数据的任何百分位数。该示例假设具有单变量数据点。例如,这些可能是从居住在大城市同一地区的一群员工收集的从家到工作地点的通勤时间。
组织数据:首先,样本中的数据点必须按升序排列。假设我们收集了9名员工的通勤时间(以分钟为单位),那么排列后的数据值可能如下所示:55、63、70、72、80、85、90、92和95。
给定百分位数,找到排名位置:假设我们要查找数据的第75个百分位数,换句话说,就是75%的员工设法到达办公室的行程持续时间。排名(我们稍后会解释)是使用以下公式计算的,其中P是指定的百分位数,N是数据点的数量。在我们的示例中,P=75和N=9:
R=(P/100)×(N+1)=(75/100)×(9+1)=7.5
解释排名:那么,这个R=7.5告诉我们什么?排名表示我们要查找的百分位值在排序数据集中的位置(请参阅步骤1)。如果R是整数值,我们只需在排序数据中定位该位置。同时,如果R不是整数,例如R=7.5,我们必须找到R上方和下方整数位置的两个连续值,在本例中为第7个和第8个值,并对它们进行平均以找到我们要查找的百分位数:
55、63、70、72、80、85、90、92、95??
由于第7个和第8个位置对应于值90和92,因此寻找的第75个百分位数是(90+92)/2=91。
解读结果:本例中获得的第75个百分位得分为91,这意味着75%的通勤者到办公室的时间低于91分钟。
现在您已经学会了如何手动计算百分位数,尝试手动计算此数据集的第40个和第80个百分位数:您应该分别得到72和92。
最后一点,如果您还尝试获取第95个百分位数,您将遇到R=9.5,这意味着排名位置位于第9个和第10个排序数据点之间。问题?我们只有N=9个数据点!在这些情况下,我们简单地假设额外的第10个位置将再次包含与最后一个位置相同的值,即95。因此,所得百分位数将为95。
文档评论(0)