第10章-多维标度解析.ppt

主编:费宇 主编:费宇 主编:费宇 中国人民大学出版社 * 主编:费宇 * 第10章 多维标度分析 10.1 多维标度法的基本思想 10.2 古典多维标度法 多维标度法的几个基本概念; 已知距离矩阵时CMDS解; 已知相似系数矩阵时CMDS解; 10.3 非度量多维标度法 10.4 案例分析与R实现 * 主编:费宇 * 第10章 多维标度分析 * 主编:费宇 * 10.1 多维标度法的基本思想 多维标度法:是用低维空间 Rk (kp)中的n个点去重新标度和展示高维空间Rp中n个点(的某种距离或某种相似性),将高维空间中的研究对象(样本或变量)简化到低维空间中进行定位、归类和分析且有效保留研究对象间原始关系的多元数据分析技术的总称. 是一种维数缩减方法,主要思想是在降维的同时让新得到的n个点与原来的n个点保持较高的相似度(如位置关系、距离、类别等). * 主编:费宇 * 多维标度法起源于上世纪40年代的心理测度. 1958年 Torgerson 正式提出了这一方法. 目前应用广泛,内容丰富,方法较多. 主要分为两类:度量分析法,非度量分析法. 它与主成分分析有相通之处: 共同点:均先降维,再做简明有效的分析; 不同点:主成分法按包含信息大小选取主成 分;多维标度法按标度前后距离阵 尽量接近或相似来构造拟合点. 10.2 古典多维标度分析 * 主编:费宇 * 例10.1 在地图上重新标度我国八个城市,使得它们之间的距离尽量接近于表10.1中的距离.   北京 天津 济南 青岛 郑州 上海 杭州 南京 北京 0             ? 天津 118 0           ? 济南 439 363 0         ? 青岛 668 571 362 0       ? 郑州 714 729 443 772 0     ? 上海 1259 1145 886 776 984 0   ? 杭州 1328 1191 872 828 962 203 0 ? 南京 1065 936 626 617 710 322 305 0 10.2.1 多维标度法的几个基本概念 * 主编:费宇 * 古典多维标度(CMDS)解的定义 对于距离阵 ,多维标度法的目的是要寻找较小的 k 和R k 中的 n个点 , 记 , 表示 xi 与 xj 在R k 中的欧氏距离,使得 与 在某种意义下尽量接近, 记 称 为 的一个古典多维标度(CMDS)解, 称xi 为 的一个拟合构造点,称 为 的拟合构图,称 为 的拟合距离阵. * 主编:费宇 * 特别,当 时 ,称xi 为 的一个构造点,称 为 的构图,注意 的构图不唯一. * 主编:费宇 * 几个相关矩阵构造: * 主编:费宇 * 距离阵为欧氏距离阵的充要条件: 从欧氏距离阵D出发得到构图 X的步骤: 见下面例10.2. * 主编:费宇 * 例10.2 由D求 X的过程示例 * 主编:费宇 * 例10.2(续) 由D求 X的过程示例 * 主编:费宇 * 10.2.2 已知距离矩阵时CMDS解 上面求解CMDS解的实现过程,可使用stats包中的cmdscale函数;也可使用MASS包中isoMDS函数. 例10.3 对表10.1给出的我国八个城市间的距离矩阵D ,利用R软件stats包中的cmdscale函数求 的CMDS解,给出拟合构图 及拟合构造点. * 主编:费宇 * 例10.3(续) # 打开数据文件eg10.3.xls, 选取C2:K10后复制 eg10.3=read.table(clipboard, header=T) #读入数据 D10.3=cmdscale(eg10.3, k=2, eig=T); D10.3 # k取为2, 并给出B的前两个特征向量和所有特征值 sum(abs(D10.3$eig[1:2]))/sum(abs(D10.3$eig)) #j算a1.2 sum((D10.3$eig[1:2])^2)/sum((D10.3$eig)^2) #算a2.2 x=D10.3$points[, 1]; y=D10.3$points[, 2] plot

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档