- 32
- 0
- 约1.95千字
- 约 4页
- 2018-10-14 发布于重庆
- 举报
统计学习数据集可视化实验报告
作业2上机题实验报告(一)实验内容:1.对Iris数据集计算其协方差矩阵和相关系数,并计算协方差矩阵的特征值和特征向量,实现KL变换。2. 分别以Iris数据集的四个变量作为坐标,画出各自的二维直方图。(二)实验原理:1. KL变换步骤:1)、减去平均值2)、计算协方差矩阵3)、计算协方差矩阵的特征值和特征向量4)、将特征值从大到小排序5)、将数据转换到上述N个特征向量构建的新空间中2. 二维直方图:直方图是用面积而非高度来表示数量。直方图由一组块形组成,每一个块形的面积表示在相应的小组区间中事例的百分数。(三)实验方案:1. KL变换:1). 方案一:按照KL变换步骤,计算出所需的去均值后的数据矩阵,数据矩阵的协方差矩阵,对应的特征值和特征向量,进行相关运行算。2). 方案二:直接调用matlab中函数princomp,正确理解相关输入参数意义,实现主成分分析。2. 二维直方图:直接调用matlab中函数hist,分别输入四个不同变量。(四)实验编程:1. KL变换:1). 样本均值:函数名称:mean函数功能:求向量或矩阵的均值函数语法:(以X为矩阵为例)mean(X) %默认dim=1)就会求X每一列的均值mean(X,2) %求X每一行的均值样本均值:2). 协方差矩阵:函数名称:cov函数功能:求协方差矩阵函数语法:cov(X) % cov(X,0) = cov(X)=vor(x)cov(X,Y) %求矩阵X与Y的协方差矩阵。若X大小为M*N,Y为K*P,则X,Y的大小必须满足M*N=K*P,即X,Y的元素个数相同。cov(X,1) %计算方法如cov(x),归一化参数为1/Ncov(X,Y,1) %计算方法如cov(x,y),但归一化参数为1/N。样本方差:样本之间协方差:3). 相关系数矩阵:函数名称:corrcoef函数功能:求相关系数矩阵函数用法:corrcoef(X) % 求矩阵X的相关系数,X每一行为一次观察,一列为一个变量corrcoef (X,Y) % X,Y必须是各维数都相同的矩阵样本之间相关系数:4). 矩阵特征值和特征向量:函数名称:eig函数功能:计算矩阵的特征值和特征向量函数语法:E=eig(A)%求矩阵A的全部特征值,构成向量E。[V,D]=eig(A)%求矩阵A的全部特征值,构成对角阵D,并求A的特征向量构成V的列向量。5).主成分分析:函数名称:princomp函数功能:主成分分析函数语法:???????[coeff, score, latent] = princomp(x)coeff : 协方差矩阵的特征向量按照特征值递减顺序排列;score:是原来的样本矩阵在新的坐标系中的表示,也就是去均值后的样本矩阵乘上转换矩阵;latent:score 矩阵每一列的方差,由latent可以算出降维后的空间所能表示原空间的程度,计算累计程度cumsum(latent)./sum(latent)可表示新空间表示原空间的程度。2. 二维直方图:函数名称:hist3函数功能:绘制直方图函数函数用法:Hist3(Y) %Y为m*2维矩阵,按10*10画直方图hist(Y,N) %按N(1)*N(2)画出直方图(五)实验结果及分析: 1.实验运行结果各参数含义:1). KL变换:covMat.mat:原始数据矩阵的协方差矩阵;correoff.mat:原始数据矩阵的相关系数;eigVals.mat:协方差矩阵的特征值;eigVects.mat:协方差矩阵的特征向量;KLMat.mat:方案一中KL变换未降维后的数据矩阵;score.mat:方案二中主成分分析未降维后的数据矩阵;2). 二维直方图:sepal length:变量1,对应原始数据矩阵第一列;sepal width:变量2,对应原始数据矩阵第二列;petal length:变量3,对应原始数据矩阵第三列;petal width:变量一4,对应原始数据矩阵第四列; 2.实验运行结果和分析:1). KL变换:实验中,对原始数据降维后重构的标准是,新数据可反映原始数据程度大于95%:在方案一中,将数据协方差矩阵的特征值从大到小排序,再将数据转换到上述N个特征向量构建的新空间中;在方案二中,直接调用函数实现主成分分析,得到新的数据矩阵‘比较可以看出,两种方案中,主成分分析后,KL变换得到数据结果相同,方案一的应用可以更清晰的理解KL变换的数学意义。2). 二维直方图:如图1,分别以Iris数据集的四个变量作为坐标,画出各自的二维直方图。图1:四个变量两两之间的二维直方图
您可能关注的文档
最近下载
- 贵州省六校联考2025届高三下学期3月高考实用性联考(四)英语试卷(含答案).docx VIP
- 颈椎病的中医护理课件.pptx VIP
- 原调正谱G小小蝴蝶la farfalletta钢琴伴奏高清打印版.pdf VIP
- 上海大学2024-2025学年第1学期《高等数学(上)》期末考试试卷(B卷)附参考答案.pdf
- 广发证券-交通银行-601328-零售转型提速,定增落地夯实资本根基.pdf
- 上海大学2024-2025学年第1学期《高等数学(上)》期末考试试卷(A卷)附参考答案.pdf
- 循环系统护理小讲课.pptx
- 建筑屋面西瓦专项施工方案(范本).doc VIP
- 2024年山东铝业职业学院单招综合素质考试题库及答案1套.docx VIP
- 探究TIPS术后支架堵塞的影响因素及抗凝治疗的必要性:基于多维度分析与临床实践.docx
原创力文档

文档评论(0)