环境数据处理与数学模型课件 04-环境数据分析方法-2(2).pptVIP

环境数据处理与数学模型课件 04-环境数据分析方法-2(2).ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
离散程度的度量 异众比率(Variation ratio) 非众数组的频数占总频数的比率 主要用于衡量众数对一组数据的代表程度,异众比率越大,众数的代表性越差 主要用于定类数据,也可以用于更高测量级别的数据 检出污染物 频数 S1 15 S2 11 S3 9 S4 6 S5 9 合计 50 异众比率高,用S1反映水体的污染,代表性不是很好 * * * * 环境数据处理与数学模型 环境数据分析方法 01 02 03 04 基本概念 数据处理与展示 描述性统计 二总体的假设检验 05 06 07 08 回归分析 主成分分析 聚类分析 时间序列分析 数据挖掘/大数据介绍(邀请讲座,待定) 02 数据处理 与展示 数据清洗 定类/定序变量的处理与展示 定距/定比变量的处理与展示 多元变量的处理与展示 数据清洗 重复数据的处理 重复数据查找:开始?条件格式?突出显示单元格规则?重复值 重复数据删除:数据?数据工具?删除重复项 缺失数据的处理 缺失值定位:开始?编辑?定位条件?空值 缺失值处理:直接剔除;用样本的平均值代替缺失值;用统计模型计算的值代替;保留缺失值的记录,在相应的分析中做必要的排除 定类数据的处理与展示 频数/频率(Frequency):落在某一特定类别中的个体个数/个数占总体的比例 展示:频数/频率表、条形图/直线图、饼状图 类别 频数 大一 80 大二 30 大三 10 大四 5 各年级参加暑期社会实践人数的频数 定序数据的处理与展示 频数/频率、频数/频率分布 累积频数(Cumulative Frequencies):将各有序了类别的频数逐级累加起来得到的频数 累积频率:将各有序类别的频率逐级累加 展示:累积频率/频数表、累积频率/频数图、Pareto图 2013年我国地表水水质状况 Pareto图 定序数据的处理与展示 累积频率图 铅浓度 (mg/L) 累积频率 (%) 2.0 0 2.9 2 3.9 6 4.9 8 5.9 20 6.9 52 7.9 68 8.9 84 9.9 92 10.9 98 11.9 100 横轴:铅浓度 纵轴:铅浓度低于横轴上给定浓度时的天数百分比(累积频率) 定序数据的处理与展示 累积频率图 铅浓度 (mg/L) 累积频率 (%) 2.0 0 2.9 2 3.9 6 4.9 8 5.9 20 6.9 52 7.9 68 8.9 84 9.9 92 10.9 98 11.9 100 20 5.9 第P个百分点:跟纵轴上P%相对应的横轴上的数值 例如:5.9mg/L对应第20个百分点,有80%的天数,排放超过了5.9mg/L 定距/定比数据的处理与展示 基于分组的 根据需求,将原始数据按照某种标准划分成不同组别 通常用组中值作为该组数据的代表值 一般要求所选取的各组间距是等宽的,使得频数大小具有较好的可比性 如果分组个数太少,会丢失很多信息;如果分组个数太多,会保留过多细节,对原始数据表达形式的改进不大 合理选取分组的边界值,边界值不重叠,避免在把观测值分配到各组时产生含糊不清的问题 定距/定比数据的处理与展示 展示:直方图(Histogram) 用矩形的宽度和高度(即面积)来表示频数分布图组数据的代表值 用于连续变量,长方形间没有间隙 代表频数/频率的是长方形的面积,不能误认为是长方形的高度 长方形高度的真正含义:代表频数/频率密度(Frequency Density)即:沿着横轴每一个单位长度对应的频数/频率 铅浓度 频数 2.0~2.9 1 3.0~3.9 2 4.0~4.9 1 5.0~5.9 6 6.0~6.9 16 7.0~7.9 8 8.0~8.9 8 9.0~9.9 4 10.0~10.9 3 11.0~11.9 1 监测到某工厂排放污水中铅的浓度(mg/L): 2.5, 3.4, 3.8, 4.8, 5.1, 5.1, 5.4, 5.7, 5,8, 5.6, 6.0, 6.2, 6.1, 6.5, 6.7, 6.9, 6.8, 6.5, 6.0, 6.1, 6.2, 6.3, 6.5, 6.8, 6.9, 6.0, 7.1, 7.2, 7.3, 7.7, 7.8, 7.9, 7.5, 7.6, 8.1, 8.2, 8.3, 8.7, 8.8, 8.9, 8.5, 8.6, 9.2, 9.4, 9.6, 9.8, 10.2, 10.4, 10.5, 11.5 2 3 4 5 6 7 8 9 10 11 12 铅浓度(mg/L) 第一个长方形的底边是从1.95到2.95,第二个是从2.95到3.95,…… 铅浓度 频数 2.0~2.9 1 3.0~3.9 2 4.0~4.9 1 5.0~5.9 6 6.0~6.9 16 7.0~7.9 8 8.0~8.

文档评论(0)

***** + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档