应用多元分析讲义下册.pdf

  1. 1、本文档共193页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
应用多元分析讲义下册

第一章 矩阵代数  §1.1 定义  §1.2 矩阵的运算  §1.3 行列式  §1.4 矩阵的逆  §1.5 矩阵的秩  §1.6 特征值、特征向量和矩阵的迹  §1.7 正定矩阵和非负定矩阵  §1.8 特征值的极值问题 八、类的个数  如果能够分成若干个很分开的类,则类的个数就比 较容易确定;反之,如果无论怎样分都很难分成明 显分开的若干类,则类个数的确定就比较困难了。  确定类个数的常用方法有: 1.给定一个阈值T。 2.观测样品的散点图。 3.使用统计量。 1.给定一个阈值T  通过观测树形图,给出一个你认为合适的阈值T, 要求类与类之间的距离要大于T,有些样品可能会 因此而归不了类或只能自成一类。这种方法有较强 的主观性,这是它的不足之处。 2.观测样品的散点图  如果样品只有两个或三个变量,则可通过观测数据 的散点图来确定类的个数。对于三个变量,可使用 SAS软件的交互式数据分析菜单系统通过旋转三维 坐标轴从各个角度来观测散点图。  如果变量个数超过三个,则可对每一可能考虑的聚 类结果分别使用费希尔判别法进行降维,将所有样 品的前两个或三个判别式得分制作成散点图,观测 类之间是否分离得较好以决定分几类较为合适。 从散点图中进行主观聚类  观测散点图还有一个重要的用途,就是从直觉上来 判断所采用的聚类方法是否合理,甚至有时直接从 散点图中进行主观的分类,效果也许会好于正规的 聚类方法,特别是在寻找“自然的”类方面。 寻找“自然的”类 3.使用统计量 2  (1)R 统计量。 2  (2 )半偏R 统计量。  (3 )伪F 统计量。  (4 )伪t统计量。 §6.4 动态聚类法  动态聚类法的基本思想是,选择一批凝聚点或给出 一个初始的分类,让样品按某种原则向凝聚点凝聚, 对凝聚点进行不断的修改或迭代,直至分类比较合 理或迭代稳定为止。类的个数k可以事先指定,也可 以在聚类过程中确定。选择初始凝聚点(或给出初 始分类)的一种简单方法是采用随机抽选(或随机 分割)样品的方法。  动态聚类法有许多种方法,本节中,只讨论一种比 较流行的动态聚类法——k均值法。k均值法是由麦 奎因(MacQueen,1967 )提出并命名的一种算法。 k均值法的基本步骤  (1)选择k个样品作为初始凝聚点,或者将所有样品 分成k个初始类,然后将这k个类的重心(均值)作 为初始凝聚点。  (2)对除凝聚点之外的所有样品逐个归类,将每个样 品归入凝聚点离它最近的那个类(通常采用欧氏距 离),该类的凝聚点更新为这一类目前的均值,直 至所有样品都归了类。  (3)重复步骤(2),直至所有的样品都不能再分配为止。  最终的聚类结果在一定程度上依赖于初始凝聚点或 初始分类的选择。经验表明,聚类过程中的绝大多 数重要变化均发生在第一次再分配中。  例9.4.1 对例9.3.1采用k均值法聚类,指定k=2 ,具 体步骤如下:  (1) 随意将这些样品分成G(0) 1,6,8 和G(0) 2,11 1   2   1 6 两类,则这两个初始类的均值分别是5和 。

文档评论(0)

wumanduo11 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档