session1、2数据模型与决策.ppt

  1. 1、本文档共138页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
session1、2数据模型与决策

数据模型与决策 Five-Number Summary Lowest Value = 425 First Quartile = 450 Median = 475 Third Quartile = 525 Largest Value = 615 Example: Apartment Rents 房屋租金例 实际举例 Inner Fences: Q1 - 1.5(IQR) = 450 - 1.5(75) = 337.5 Q3 + 1.5(IQR) = 525 + 1.5(75) = 637.5 Outer Fences: Q1 - 3(IQR) = 450 - 3(75) = 225 Q3 + 3(IQR) = 525 + 3(75) = 750 There are no mild or extreme outliers. 375 400 425 450 475 500 525 550 575 600 625 Box Plot 箱图 实际举例 Measures of Association Between Two Variables 双变量相关关系度量 Covariance 协方差 Correlation Coefficient 相关系数 Covariance协方差 正值表示正相关 负值表示负相关 如果数据集是样本,协方差记为 sxy. 如果数据集是总体,协方差记为 Correlation Coefficient 相关系数 相关系数在 -1 and +1. 值接近 -1 表示强烈地负线性相关 值接近+1 表示强烈地正线性相关. 如果数据集是样本, 相关系数记为 rxy. 如果数据集为总体,相关系数记为 The Weighted Mean and Working with Grouped Data 加权平均数和分组数据的加权平均数 The Weighted Mean 加权平均数 Grouped Data 分组数据 The Weighted Mean 加权平均数 加权样本平均数 加权总体平均数 Mean for Grouped Data 分组数据平均数 Sample Data Population Data Variance for Grouped Data 分组数据方差 Sample Data Population Data Shape 形状 描述数据是如何分布的 形状的度量: 对称性(Symmetric) 或歪曲性 (skewed) Right-Skewed Left-Skewed Symmetric Mean = Median = Mode Mean Median Mode Median Mean Mode Session Summary 本讲小结 小结 各种表格方法是对统计数据进行初步描述的清晰 易懂的方法 各种图形方法可为决策者理清数据的一些规律, 以便于决策制定 数值方法是对数据进行统计描述的最可靠方法, 可对数据的集中程度、分散程度和对称程度进行 分析 The End of Session 2 修剪的平均数 5% trimmed mean = Example: Apartment Rents 房屋租金例 实际举例 Median 中位数 将所有数据按上升排序,位于中央的数据为中位数 如果数据个数为奇数,中位数为位于中央的数据 如果个数为偶数,中位数为中央两位数的平均 Median 中位数 Median = (475 + 475)/2 = 475 Example: Apartment Rents 房屋租金例 实际举例 Mode 众数 众数是在数据集中发生频率最高的数据值 实际举例 Percentiles 百分位数 第P百分位数是指,至少有P%的数据项小于或等于这个值,且至少有(100-P)%的数据项大于或等于这个值 递增排序 计算指数 i= (p/100)n 若i 不是整数,将其向上取整 若i是整数,则p分位数为第i项与第i+1项的数据的平均值 90%分位数 i = (p/100)n = (90/100)70 = 63 90th Percentile = (580 + 590)/2 = 585 Example: Apartment Rents 房屋租金例 实际举例 Quartiles 四分位数 四分位数是特定的百分位数 第一个四分位数为25%百分位数 第二个四分位数为50%百分位数即中位数 第三个四分位数为75%百分位数 第三个四分位数 Third quartile = 7

文档评论(0)

精品文档 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档