- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二章 环境数据
统计与分析
2 环境数据统计与分析
• 2.1 数据统计与分析的基本范畴
• 2.2 常用的统计指标
• 2.3 环境样本特征推断
• 2.4 参数估计
• 2.5 显著性检验
• 2.6 直线相关与直线回归
• 2.7 环境数据统计与分析的计算机处理
• 2.8 可疑值的取舍
2.1 数据统计与分析的基本范畴
2.1.1 总体与样本
统计学中,把性质相同的研究对象的所有观
测结果的集合称为总体(population)。总体又分为
无限总体和有限总体。
在实际工作中,常常是从被研究的总体中随
机抽取部分观测结果进行研究。每个部分观测结
果的集合称为样本。
从总体中随机抽取样本用以推断总体的方法
称为抽样研究。
2.1.2 参数与统计量
• 统计指标
统计学中,把根据规定的函数关系计算出的描述
总体或样本特征的函数值称为统计指标(index)。
• 参数
由总体资料计算出的统计指标称为参数(
parameter),用于描述总体特征。
• 统计量
由样本资料计算出的统计指标称为统计量(
statistic ),用于描述样本特征 。
2.1.3 变异与误差
• 变异(variation )
变异指观测结果之间实际存在的差异。
• 误差(error )
误差指观测结果与真实值之差及统计量与参数
之差。
– 过失误差(gross error )——过失误差可以避免;
– 系统误差(systematic error )——系统误差可以减少;
– 随机误差(random error)—— 随机误差无法消除。
2.2 常用的统计指标
• 2.2.1 平均数
• 2.2.2 变异数
• 2.2.3 相对数
2.2.1 平均数
• 定义
平均数(average )是表示观测值的平
均水平的统计指标,常用的有算术平均数
、几何均数及中位数。
2.2.1.1 算术均数
• 定义
算术均数(arithmetic mean ),简称
均数,常用、希腊字母μ表示,表示样本
均数,μ表示总体均数。均数适用于正态
分布资料统计。
• 计算方法
– 直接计算法
– 频数-加权计算法
直接计算法
当观察值的个数不多时,将所有观察值x1,x2
,x ,…,x 直接相加,其和除以观察值的个数n
3 n
,即为均数。
计算公式:
式中, 算术平均数
X
x1,…,xn 各观察值
∑ 求和符号
∑x 观察值总和
n 观察值的个数
频数-加权计算法
对一个随机事件作重复观察,其中某观察值
出现的次数称频数;
各观察值对应的频数称为频数分布;显示各
观察值对应的频数的表格称为频数分布表,简称
频数表。
频数-加权计算法计算步骤
① 计算全距
找出观察值中的最大值、最小值,并计算全距(range),
全距=最大值-最小值。
② 定组段数
一般取8~15个为宜,多取10个,组段数太多,计算较繁,
组段数过少则误差较大。
③ 定组距(class interval )
相
文档评论(0)