- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二章 数据的描述与汇总统计 2.1 数据的整理与展示 社会、经济数据的特点: 样本点数量大、指标变量多、带有动态特性 数据分析的基本作为: 1. 描述和分析系统特征(现状、结构、因素之间关系等) 2. 分析系统的运行规律与发展趋势(动态数据) 3. 对系统的未来状态进行预测(建立模型) 2.2 数据的种类 一、数据计量的尺度 不同类型的数据在计算时的性质不一样 (1)对于定量数据可以进行数学运算 (2)顺序变量有时有计算意义 好 中 差 3 2 1 (3)对名义变量无法计算 黄 红 绿 3 2 1 三、 数据收集与提供方式—数据表 1. “样本点?变量”型 数据表 X 有 n 个样本点:e1,e2,…,en,每个样本点均由 p 个指标来描述。 数据表 X 有 p 个变量:x1,x2,…,xp; xj表示: 所有样本点在 j 指标上的取值。 北京市三次产业结构分析 2002年三次产业内部结构 2、北京市劳动就业需求预测分析(2003) 全市从业人口占总人口的比例(劳动参与率) 北京市GDP与就业人口的变化趋势 全市各所有制从业人员状况 按所有制的从业人员数量趋势 “其他”经济成分中的从业人员情况 北京市GDP、财政收入、就业的增长率 描述性统计的基本原则 1、直观:能清晰地表达主题 2、醒目:信息点特别突出 3、变化:图形使用应丰富多彩 4、图、文并茂:文字应与图、表的篇幅平衡 5、详略得当,防止冗长的流水帐 2.4 数据的概括性度量 一. 数据的分布中心 关于数据集合的集中趋势的测度 1. 中位数 (Median): 将数据从小到大排序,中间位置的观测值 将n 个数据排序:x1 ? x2 ? … ? xn (1) min = x1 (2) max= xn (3) 中位数: 处于中间的位置观测值。 观测值个数是奇数时的中位数: 顺序变量的中位数: 阅读教材中 P65-66,例3-9 例2-5(P34):某调查公司开展了对消费者对某个品牌洗发水的信任度调查,共随机调查了300名消费者,调查结果如下: 例 4: 某公司职工的教育背景 . 最高学历 频数 初中 15 高中 200 大学 185 硕士 55 博士 70 其他 25 总计 550 众数 = 注意: 对于定性数据,不存在平均值和中位数. 3. 均值 (Mean) 性质: (1) 观测值与均值的离差和为零: 例如. 31 , 38, 45, 50 均值= 41 -10, -3, 4, 9 总和=0 (2)观测值与均值的离差的平方和取到最小值。 应用建议: (1)对于名义变量,描述集中趋势的办法是: (2)对于顺序变量,描述集中趋势的最常用的办法是: (3)对于定量变量,一般使用平均值。 但当数据的直方图显示出是非对称(偏斜)分布时,常常使用中位数。 北京市平均工资的统计缺陷 2009年北京职工年平均工资为48444元(每月约4037元) 北京市平均工资的现行统计方法 北京职工平均工资是根据城镇单位上报的劳动情况表汇总计算而来(统计范围为“城镇单位”,不包括私营单位和个体工商户。) 调查方法:基本采用全面调查,共调查了全市7.9万个单位。 统计方法:用各个单位的工资总额相加后,再除以全部职工人数,计算出职工平均工资。 关于按行业平均工资分层确定北京地区社保缴费基数的建议 2010年7月16日北京市统计信息网: 2009年, 从19大行业看,职工年平均工资差距非常明显。其中,有10个行业职工的年平均工资低于全市平均水平,平均工资最低的三个行业分别是“居民服务和其他服务业”,“农、林、牧、渔业”,“住宿和餐饮业”。这三个行业的职工年平均工资分别为21454元、24881元和25078元; 工资最高的三个行业分别是“金融业”,“信息传输、计算机服务和软件业”,“电力、燃气及水的生产和供应业”,职工年平均工资分别为174183元、81319元和74071元。 “金融业”的职工年平均工资约为“服务业”的 8.2倍。 以全社会平均工资作为企业社保缴费基数,必然会造成一部分行业的企业社保缴纳负担过重,增加企业的人工成本,不利于企业的健康和可持续发展。特别对于劳动密集型企业或微利企业,影响则更为突出。 3. 方差 ( Variance ) 问题:如何全面测度观测点集合的差异程度 例如:下面的 3 个观测集合,哪个总体
文档评论(0)