- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《数量方法》串讲讲义第一章数据分析的基础
一、数据集中趋势的度量: ?平均数:
全体数据的和数据的个数
全体数据的和
数据的个数
,其中数据为
(组中值频数)的和②分组数据的加权平均数 频数的和①n个数据的
算术平均数二
其中m为组数,yi为第i组的组中值,vi为第i组频数。
优点:平均数容易理解,计算;它不偏不倚地对待每一个数据;是数据集的“重 心”
缺点:对极端值十分敏感。
【例题】如果一组数据分别为10,20,30和x,若平均数是30,那么x应为
30 B? 50 C? 60 D? 80
【答案]选择C
、 【解析】考察的知识点为平均数的计算方法。
【例题】某企业辅助工占80%,月平均工资为500元,技术工占20%,月平 均工资为700元,该企业全部职工的月平均工资为【】
A. 520 元 B. 540 元 C. 550 元 D. 600 元
【答案】选择B
【解析】考察的知识点为加权平均数的计算方法。
?中位数:将数据按从小到大顺序排列,处在中间位置上的一个数或最中间两个 数的平均数。
若n为奇数,则位于正中间的那个数据就是中位数,即 就是中位数。
2
若n为偶数,则中位数为
2就是中位数。
优点:中位数对极端值不像平均数那么敏感
缺点:没有充分地利用数据所有信息
【例题】八位学生五月份的伙食费分别为(单位:元)
360 400 290 310 450 410 240 420则这8位学生五刀份伙食费中位数为【】
A. 360 B ? 380 C? 400 D? 420
[答案]B
【解析】共有偶数个数,按从小到人排列后,第4位数360与第5位数400求 平均为380
1
?众数:数据屮出现次数最多的数。
优点:它反映了数据中最常见的数值,不仅对数量型数据(数值)有意义,对分 类型数据也有意义;它能够
告诉我们最普遍、最流行的款式、尺寸、色彩等产品特征。 缺点:一组数据可能没有众数,也可能众数不唯一。
【例题】对于一列数据来说,其众数( )
A.—定存在B.可能不存在
【答案】BC.是唯一的D.是不唯一的
【例题】数列2、3、3、4、1、5、3、2、4、3、6的众数是 。
?平均数,屮位数和众数的大小关系:
频率直方图是单峰对称:平均数二中位数二众数 频率直方图是左偏分布:众数lt;中位数lt;平均数 频率盲方图是右偏分布:平均数lt;中位数lt;众数 众 数:频率分布直方图中最高矩形的底边中点的横坐标。
平均数:频率分布直方图各个小矩形的面积乘底边中点的横坐标之和。
中位数:把频率分布直方图分成两个面积相等部分的平行于Y轴的直线横坐 标。
四、数据离散趋势的度量:
?极差 R=max-mino
优点:容易计算
缺点:容易受极端值的影响
?四分位极差=Q3-Qlo
第2四分位点Q2=全体数据的中位数;
第1四分位点Q1二数据中所有SQ2的那些数据的中位数; 第3四分位点Q3二数据中所有NQ2的那些数据的中位数。
优点:四分位极差不像极差R那样容易受极端值的影响 缺点:没有充分地利用数据所有信息
?方差:反映数据离开平均数远近的偏离程度。
lnl222n个数据的方差:
21ml222分组数据的方差: 其中m, yi, vi同上,n是数据的个数,是分组数据的加权平均数。2
?标准差:
?变异系数: 方差的算术平方根,与原来数据的单位相同)(%)(反映
数据相对于其平均数的分散程度
两组数据的平均数不同或两组数据的单位不同时用。
【例题】为了调查常富县2002年人均收入状况,从该县随机抽取100人进行 调查,得到年人均收入的数据如下(单位:万元人
根据上述分组数据,回答下面的问题:
画出收入分布的直方图,并说明分布的形状(5分) 计算该样本的年人均收入及标准差(6分)
收入最高的20%的人年均收入在多少以上? (3分) 【答案】1.
人数
频数40
20
2.
年人均收入
100 =0.96
21m
方差
标准差
3?收入最高的20%的人年均收入在1.5万元以上
【解析】本题考察的知识点为第一章的基本知识:
直方图的画法,分组数据的均值和方差的求法。
【例题】在一次知识竞赛中,参赛同学的平均得分是80分,方差是16,则得 分的变异系数是(
A.0.05B.0.2 C.5 D.20
【答案】A.
【解析】根据变异系数公式:
,得出 4/80=0.05
3)
四、相关分析:
?相关关系:变量之间存在不确定的数量关系
线性相关:变量的关系近似线性函数;
不完全正线性相关 不完全线性相关 不完全负线性相关 完全正线性相关 完全线性相关 完全负线性相关
1.
完全菲线性相关 不完全非线性相关
3.不相关:变量之间没有任何规律。
?简单相关系数:(xl,yl),,,,(xn,yn)是总体(X,Y)的n对观察值 或
记xy
nx2
旧。
文档评论(0)