- 1、本文档共13页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第03章描述统计第03章描述统计
补充材料:累计求和运算规则
求和算子定义:对于T个观测值,x1, x2, …, xT,求和可以简化地表示为
x1 + x2 + …+ xT =
其中称作求和算子。求和算子的运算规则如下:
① 变量观测值倍数的和等于变量观测值和的倍数。
= k
② 两个变量观测值和的总和等于它们分别求总和后再求和。
= +
③ T个常数求和等于该常数的T倍。
= kT
其中k是常数。
④ 定义双重求和为
= xi1 + xi 2 + …+ xiT)
= (x11 + x12 + …+ x1T) +
(x21 + x22 + …+ x2T) +
… +
(xT1 + xT2 + …+ xTT)
⑤ 两个变量和的双重求和等于它们各自双重求和的和。
= +
⑥ 两个不同单下标变量积的双重求和等于它们各自求和的乘积。
= () ()
证:
= = () ()
第3章 统计资料的综合(Data Summarization)
用频数分布表与统计图可以展示数据分布的大概特征。为更准确的描述数据的特征,有必要用一些数值描述一组数据的特征,称这些数值为特征数。
特征数分三类:
(1)表示集中位置;(2)表示分散程度;(3)表示偏斜程度;(4)相关程度。
3.1 表示集中位置的特征数:
(1)平均数;(算术平均数,几何平均数,调和平均数)
(2)中位数;
(3)众数;
(4)百分位数;
3.1.1 平均数
(1)算术平均数(Arithmetic mean)
对于不分组数据
算术平均数定义:一组数据,(x1, x2, …, x n),容量为n,则算术平均数表示为
= = (1)
例1:5个学生的英语考试分数是80, 70, 85, 90, 82。则平均考试分数
== 81.4
算术平均数的性质:
① 观测值的和等于其平均数与观测值个数的乘积。对(1)式两侧同乘n得,
= n
说明有代表性。若不考虑xi的差异。用代替xi,并乘n,则总和相等。所以人们常用描述数据。如平均年龄,平均工资等。
② 一组观测值与其平均数的离差和等于零。
= 0
证: == - n= 0(利用性质①)
此性质以后常常用到。
③ xi与某一定值 A的离差平方和
- A)2
以A =时为最小。
证:- A)2 =+ (- A)] 2 =2 + 2 (- A) +
=+
可见只有当= A时,方程左端的值才最小。
当数据为分组形式时,
(=(f1x1 + f2 x2 + … + fk xk ) (2)
其中:k为分组数;x i 为第i组的组中值;fi 为观测值落入第i组的频数;n 为观测值总个数,n = f1 + f2 + … + fk。
分组数据形式下求得的平均数,只是用原始数据计算的的近似值。只有当各组中值与相应组内观测值的平均值全相等时,(1)、(2)式的计算结果才相等。因此,只要条件允许,应该用原始数据直接计算。当n很大时,由(2)式计算的的误差会减小。
例2:见30页例2。
例2:见第2章例2,婴儿体重分组数据分布表如下:
体重(克) 频数 组中值 2400—2700 以下 2 2550 2700—3000 以下 3 2850 3000—3300 以下 8 3150 3300—3600 以下 5 3450 3600—3900 以下 2 3750
== 3180
若用原始数据直接计算(见第2章例2,北京妇产科医院新生儿体重分布)
== 3149
(2)几何平均数(Geometric mean)
当数据是以环比形式给出时,应该用几何平均数求该数据的平均递增率。
定义:一组环比数据r1, r2, …, rn(容量为n),则几何平均数
G = (3)
例3:有天津市“六五”期间工农业总产值环比指数如下
年份 环比指数 1980 1.000 1981 1.059 1982 1.069 1983 1.082 1984 1.116 1985 1.157
G = = 1.096
即1980—1985
文档评论(0)