- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Unit 3 Unit 3 * 孙善伟 2011-10-8 统计方法与数据分析 Statistical Methods and Data Analysis * 什么是统计? 1.统计是用来处理数据的:数据数字 2.统计运用的工具:1)计算;2)图表 统计是一门从数据中学习的科学,即从数据中找出信息,并且得出结论。 * 为什么要学习统计? 1.社会科学、行为学、生物学、物理学、人类学… 美国研究生的必修课。 2.商业:运用抽样数据预测未来的销售额和利润; 工程、制造业:质量监督; other:主管会计对账目的稽查ect. 统计在科学、商业、工业等几乎所有领域中都扮演着重要的角色。 几个问题? * 本课程的内容--- 统计 1.描述性统计 2.推论性统计 3.图形应用 * 描述性统计 Descriptive Statistic 用于整理、描述所收集数据的特征. 人的特征?数据特征? 描述性统计 ①中心趋势度量 ②变异性度量 * 集中趋势量数--- 1.均值(Mean): 调整平均值(截尾平均值) 加权平均值 2.中位数(Median):一系列数据的中点。 下四分位数(Q1)、上四分位数(Q3); 3.众数(Mode):出现次数最多的数值。 最笼统、最不精确的集中趋势量数。 中国CPI构成和各部分比重,2011年最新调整为: 1 食品 31.79% 2 烟酒及用品 3.49% 3 居住 17.22% 4 交通通讯 9.95% 5 医疗保健个人用品 9.64% 6 衣着 8.52% 7 家庭设备及维修服务 5.64% 8 娱乐教育文化用品及服务13.75% ※思考:均值有何缺陷? * 集中趋势量数的性质--- 均值---- 1.均值是测量值的算术平均值; 2.一个数据集合仅有一个均值; 3.均值受极值的影响;截尾有助于减少这种影响 4.仅适用于定量数据。 中位数---- 1.中位数是数据的中点,50%的数据比它大,50%的数据比它小; 2.一个数据集合仅有一个中位数; 3.不受极端测量值的影响; 4.仅适用于定量数据。 * 集中趋势量数的性质--- 众数---- 1.众数是数据集中出现次数最多的数据; 2.一个数据集合中可能存在不止一个众数,也可能不存在众数; 3.适用于定量数据和定性数据。 例1.下列数据集的众数是--- A) 4、5、5、6、8、8、9 B) 格力、美的、格力、格力、 C) 1、2、4、5、7 * 数据的变异性--- 数据集一:7、6、3、3、1 数据集二:3、4、4、5、4 数据集三:4、4、4、4、4 只用集中趋势量描述数据集充分吗? 变异性:也叫散布或离散度;是对不同数值之间的差异性的测量。 变异性的计算?特定值? 变异性:数据中每一个数值与均值的差异性的度量。 * 变异量数--- 极差(range):R=max - min; 标准差(standard deviation):一个数组中变异性的平均数量。 ∑ (Xi–X )2 n – 1 S= 标准差的计算公式: ※思考--- 1)为什么是取的平方根? 2)为什么除以n-1而不是除以n? 四分位数极差:IQR=Q3-Q1; * 变异量数--- 标准差的性质: 1)标准差是作为偏离平均值的平均距离计算的; 2)标准差越大,数值分布越广,数值之间的相互差异越大; 3)和均值一样,标准差对极值很敏感; ※思考: 如果S=0,是否代表数据组中的数据就绝对没有变异性? * 变异量数--- 方差(Variance):标准差的平方。 ∑ (Xi–X )2 n – 1 S2 = 方差的计算公式: ※思考: 方差一般不用作描述性统计,是不是说方差不重要? * 推论性统计--- 描述性统计是用于描述样本的特征,而推论统计是基于样本特征推断总体的某些特征。 推论性统计 ①估计:点估计、区间估计; ②检验:t检验、方差分析… * 点估计与区间估计--- 区间估计:通过从总体中抽取的样本,根据一定的正确度与精确度的要求,构造出适当的区间,以作为总体的分布参数的真值所在范围的估计. 点估计:又称为定值估计,就是用实际样本指标的数值作为总体的估计值。 点估计 1.样本均值作为母体均值的估计 2.样本方差作为母体方差的估计 3.样本相关系数作为母体相关系数的估计 原理:区间估计(interva
原创力文档


文档评论(0)