- 1、本文档共193页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
应用多元分析讲义下册
第一章 矩阵代数
§1.1 定义
§1.2 矩阵的运算
§1.3 行列式
§1.4 矩阵的逆
§1.5 矩阵的秩
§1.6 特征值、特征向量和矩阵的迹
§1.7 正定矩阵和非负定矩阵
§1.8 特征值的极值问题
八、类的个数
如果能够分成若干个很分开的类,则类的个数就比
较容易确定;反之,如果无论怎样分都很难分成明
显分开的若干类,则类个数的确定就比较困难了。
确定类个数的常用方法有:
1.给定一个阈值T。
2.观测样品的散点图。
3.使用统计量。
1.给定一个阈值T
通过观测树形图,给出一个你认为合适的阈值T,
要求类与类之间的距离要大于T,有些样品可能会
因此而归不了类或只能自成一类。这种方法有较强
的主观性,这是它的不足之处。
2.观测样品的散点图
如果样品只有两个或三个变量,则可通过观测数据
的散点图来确定类的个数。对于三个变量,可使用
SAS软件的交互式数据分析菜单系统通过旋转三维
坐标轴从各个角度来观测散点图。
如果变量个数超过三个,则可对每一可能考虑的聚
类结果分别使用费希尔判别法进行降维,将所有样
品的前两个或三个判别式得分制作成散点图,观测
类之间是否分离得较好以决定分几类较为合适。
从散点图中进行主观聚类
观测散点图还有一个重要的用途,就是从直觉上来
判断所采用的聚类方法是否合理,甚至有时直接从
散点图中进行主观的分类,效果也许会好于正规的
聚类方法,特别是在寻找“自然的”类方面。
寻找“自然的”类
3.使用统计量
2
(1)R 统计量。
2
(2 )半偏R 统计量。
(3 )伪F 统计量。
(4 )伪t统计量。
§6.4 动态聚类法
动态聚类法的基本思想是,选择一批凝聚点或给出
一个初始的分类,让样品按某种原则向凝聚点凝聚,
对凝聚点进行不断的修改或迭代,直至分类比较合
理或迭代稳定为止。类的个数k可以事先指定,也可
以在聚类过程中确定。选择初始凝聚点(或给出初
始分类)的一种简单方法是采用随机抽选(或随机
分割)样品的方法。
动态聚类法有许多种方法,本节中,只讨论一种比
较流行的动态聚类法——k均值法。k均值法是由麦
奎因(MacQueen,1967 )提出并命名的一种算法。
k均值法的基本步骤
(1)选择k个样品作为初始凝聚点,或者将所有样品
分成k个初始类,然后将这k个类的重心(均值)作
为初始凝聚点。
(2)对除凝聚点之外的所有样品逐个归类,将每个样
品归入凝聚点离它最近的那个类(通常采用欧氏距
离),该类的凝聚点更新为这一类目前的均值,直
至所有样品都归了类。
(3)重复步骤(2),直至所有的样品都不能再分配为止。
最终的聚类结果在一定程度上依赖于初始凝聚点或
初始分类的选择。经验表明,聚类过程中的绝大多
数重要变化均发生在第一次再分配中。
例9.4.1 对例9.3.1采用k均值法聚类,指定k=2 ,具
体步骤如下:
(1) 随意将这些样品分成G(0) 1,6,8 和G(0) 2,11
1 2
1
6
两类,则这两个初始类的均值分别是5和 。
您可能关注的文档
最近下载
- 第一章 2.2 水量平衡.ppt
- 《GB/T 19326-2022锻制支管座》.pdf
- 2022年11月陕西省从优秀村社区干部中考试录用200名乡镇街道机关公务员上岸冲刺卷I含答案详解版(3套).docx VIP
- 2020年银行业从业人员职业操守和行为准则.pdf VIP
- 转预备党员思想汇报【银行】.pdf VIP
- 【新教材】人教版(2024)七年级上册英语Unit 4 My Favourite Subject教案.docx
- 米厂恒温仓库工程设计方案.docx
- 2024年党校入党积极分子培训考试必考重点知识汇编(共160题).doc VIP
- 《世界经典神话与传说故事》 测试题及答案.pdf
- 智能制造设备安装与调试职业技能等级标准(2021年).pdf
文档评论(0)