数据可视化分析——基于R语言(第2版)贾俊平-(06)第6章 样本相似性可视化.pptxVIP

  • 156
  • 0
  • 约3.93千字
  • 约 22页
  • 2023-04-18 发布于浙江
  • 举报

数据可视化分析——基于R语言(第2版)贾俊平-(06)第6章 样本相似性可视化.pptx

R 语言数据可视化分析 贾俊平2023/4/13 贾俊平2023/4/136.1 轮廓图和雷达图6.2 星图和脸谱图6.3 聚类图和热图第 6 章 本相似性可视化 样本相似性轮廓图和雷达图轮廓图雷达图星图和脸谱图星图脸谱图聚类图和热图聚类图热图思维导图 6.1 轮廓图和雷达图 轮廓图——例题分析轮廓图(outline plot)也称平行坐标图或多线图用X轴表示各样本,用Y轴表示每个样本的多个变量的数值(X轴和Y轴可以互换),将同一样本在不同变量上的观测值用折线连接起来观察轮廓图中各折线的形状及其排列方式,可以比较各样本在多个变量上取值的相似性及差异【例 6-1】2017年全国31个地区的8项人均消费支出数据。使用DescTools包中的PlotLinesA函数绘制的31个地区8项消费支出的轮廓图 6.1 轮廓图和雷达图 轮廓图——例题分析【例 6-1】使用ggiraphExtra包中的ggPair函数绘制的按区域划分分组的轮廓图【例 6-1】按三大地带分组的轮廓图 6.1 轮廓图和雷达图 雷达图——例题分析雷达图(radar chart)也称为蜘蛛图(spider chart)它是从一个点出发,每个变量用一条射线表示,P个变量形成P条射线(P个坐标轴),每个样本在P个变量上的取值连接成线,即围成一个区域,多个样本围成多个区域,就是雷达图P个变量的计量单位可能不同,数值的量级往往差异很大,每条坐标轴的刻度需要根据每个变量单独确定,因此,不同坐标轴的刻度是不可比的利用雷达图也可以研究多个样本之间的相似程度【例 6-1】使用fmsb包中的radarchart函数绘制的北京、天津、上海3个地区8项消费支出的雷达图 6.1 轮廓图和雷达图 雷达图——例题分析【例 6-1】ggiraphExtra包中的ggRadar函数绘制的31个地区8项消费支出的雷达图,图中使用尺度缩放后的数据【例 6-1】按三大地带分组的雷达图,图中使用的是原始数据尺度 6.1 轮廓图和雷达图 雷达图——例题分析【例 6-1】按区域划分分面的雷达图,图中使用的是原始数据 6.2 星图和脸谱图 星图——例题分析星图(star plot)也被称为雷达图它用P个变量将圆P等分,并将P个半径与圆心连接,再将一个样本的P个变量的取值连接成一个P边形,n个样本形成n个独立的P边形,即为星图利用星图可根据n个P边形比较n个样本的相似性。绘制星图时,因各样本的计量单位可能不同,或不同变量的数值差异可能很大,因此需要先对变量做标准化处理,之后再绘制星图【例 6-1】stars函数绘制的31个地区8项消费支出的星图 6.2 星图和脸谱图 星图——变种形式——例题分析【例 6-1】symbols包中的symbol函数绘制的31个地区8项消费支出的太阳图【例 6-1】symbols包中的symbol函数绘制的31个地区8项消费支出的条形图矩阵 6.2 星图和脸谱图 脸谱图——例题分析脸谱图(faces plot)由美国统计学家Chernoff(1973)首先提出,也称为Chernoff脸谱(Chernoff faces)脸谱图将P个变量(P个维度的数据)用人脸部位的形状或大小来表征通过对脸谱的分析,可根据P个变量对样本进行归类或比较研究按照Chernoff提出的画法,由15个变量决定脸部的特征,若实际变量更多,多出的将被忽略;若实际变量较少,变量将被重复使用15 个变量代表的面部特征变量面部特征变量面部特征变量面部特征1脸的高度(height of face)6笑容曲线(curve of smile)11发型(styling of hair)2脸的宽度(width of face)7眼睛高度(height of eyes)12鼻子高度(height of nose)3脸的形状(shape of face)8眼睛宽度(width of eyes)13鼻子宽度(width of nose)4嘴的高度(height of mouth)9头发高度(height of hair)14耳朵宽度(width of ears)5嘴的宽度(width of mouth

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档