多元统计分析技术方法.pptVIP

  • 17
  • 0
  • 约5.41千字
  • 约 51页
  • 2018-04-09 发布于天津
  • 举报
多元统计分析技术方法.ppt

基本步骤 1、先对数据进行变换处理,消除量纲对数据的影响; 2、认为各样本点自成一类(即n个样本点一共有n类),然后计算各样本点之间的距离,并将距离最近的两个样本点并成一类; 3、选择并计算类与类之间的距离,并将距离最近的两类合并; 4、重复上面作法直至所有样本点归为所需类数为止; 5、最后绘制聚类图。 应用实例 【例11.3】为了研究2000年我国部分地区工业企业经济效益的分布规律,根据调查资料做类型划分。 基本思想 判别分析是在已知研究对象用某种方法已分成若干类的情况下,确定新的观察数据属于已知类别中的哪一类的分析方法。 判别分析方法在处理问题时,通常要给出一个衡量新样本与已知组别接近程度的描述指标,即判别函数,同时也指定一种判别规则,用以判定新样本的归属。 基本方法 距离判别 费歇尔判别 贝叶斯判别 判别效果的评价 每次从已知类别的样本中剔除一个样本点,用剩余的样本建立判别函数,然后用这一判别函数去判别被剔除的样本;依此类推,直到所有已知类别的样本都被判别过。记下所有被错判的样本,计算出每个总体中的错判率和总的错判率,根据错判率的大小来衡量判别效果。 基本步骤 1. 计算判别函数; 2. 检验判别效果; 3. 根据判别函数对待判样本进行判别所属类别。 应用实例 【例11.4】13个地区按经济效益已分为两大类,若又取得三个地区的资料,试对其进行判别分析。 地区 工业增加值率(%) X1 总资产贡献率(%)X2 资产负债率(%)X3 流动资产周转次数X4 成本费用利润率(%)X5 劳动生产率(元/人年)X6 产品销售率(%)X7 类别 北 京 天 津 河 北 山 西 内蒙古 辽 宁 吉 林 上 海 江 苏 浙 江 安 徽 福 建 江 西 27.90 27.28 36.46 36.80 38.09 28.15 28.18 29.29 26.48 26.48 32.67 34.22 28.51 5.22 8.12 8.12 5.41 6.09 7.36 8.28 9.01 8.58 10.84 7.35 10.89 6.40 57.23 58.84 60.28 62.59 57.37 59.49 64.72 47.48 59.73 55.04 60.96 58.52 67.53 1.31 1.85 1.49 .88 1.24 1.48 1.28 1.51 1.68 1.85 1.36 1.85 1.19 2.63 6.80 5.49 2.49 2.31 4.67 6.20 7.21 4.48 6.67 2.67 6.79 1.55 3987.95 8191.27 2629.81 4413.53 5129.88 7955.68 0141.03 8816.16 6044.81 6785.21 5674.30 1263.70 9123.49 98.10 99.35 98.90 97.97 99.02 98.37 98.89 99.46 98.26 98.22 99.11 97.84 98.11 1 2 1 1 1 2 2 2 2 2 1 2 1 山 东 32.60 11.70 61.54 1.92 8.42 52621.24 98.32 待判 河 南 30.77 7.39 65.02 1.23 4.07 29296.86 98.31 待判 湖 北 33.75 7.46 62.58 1.23 4.58 49374.62 101.23 待判 工业增加值 资产贡献率 资产负债率 流动资产周转次数 劳动生产率 产品销售率 …… 企业经济效益 高校科研情况 学校教师人数 承担科研项目 学校科研经费 课题项目完成数 获得奖励数 …… 二维空间 以两个指标为例,信息总量以总方差表示: 其中y1、y2分别都是x1、x2的线性组合,并且信息尽可能地集中在y1上。在以后的分析中舍去y2,只用主成分y1来分析问题,起到了降维的作用。 多元统计分析方法研究 一、如何做主成分分析 二、如何做因子分析 三、如何做聚类分析 四、如何做判别分析 第十一章 主成分分析 一、基本思想 二、数学模型 三、模型的求解 四、主成分的性质 五、基本步骤与应用实例 因子分析 一、基本思想 二、数学模型 三、因子载荷的统计含义 四、因子的求解 五、因子得分 六、基本步骤与应用实例 聚类分析 一、基本思想 二、统计量 三、分类方法 四、基本步骤与应用实例 判别分析 一、基本思想 二、基本方法 三、判别效果的评价 四、基本步骤与应用实例 基本思想 主成分分析就是设法将原来指标重

文档评论(0)

1亿VIP精品文档

相关文档