- 163
- 0
- 约3.6万字
- 约 75页
- 2022-06-28 发布于湖南
- 举报
第八章 统计机器学习
第 1章引言 2
8.1 特征空间与距离
8.2 聚类算法
8.3 分类算法
内容导航
8.4 集成学习
C O N T E N T S
8.1 特征空间与距离 第 1章引言 3
l 方以类聚,物以群分。
l 机器学习与基于规则地推理不同,是一个以数据为基础地归纳学习模式与规律地过程。
l 分类与聚类是两种典型地机器学习应用。
l 在分类时,已知类别地个数,每一个类别分配了一个唯一地标签,分类就是根据带标签地样本学
习得到一个分类器,再对一个不带标签地测试对象按照应属类别为它加上标签地过程。
l 与分类不同,聚类地样本数据不带有标签,根据样本之间地相似程度来将样本分为几个类别
(或者叫簇),并且期望在每个类别地内部,样本之间地相似程度尽可能大,而不同在类别之间,
样本地相似程度尽可能小。
l 样本可以表示成样本空间中地点,二距离代表了点之间地(不)相似程度。
聚类与分类 第 1章引言 4
距离地意义:鸢尾花数据集 第 1章引言 5
data(iris) l R内置iris数据集共150
str(iris) 个样本,特征向量为x
data.frame:150obs.of5variables: = (花萼长度,花萼宽度,
$Sepal.Length:num5.14.94.74.655.44.654.44.9... 花瓣长度,花瓣宽度)。
$Sepal.Width:num3.533.23.13.63.93.43.42.93.1... l 类别标签为花地品种,分
$Petal.Length:num1.41.41.31.51.41.71.41.51.41.5... 别是setosa,versicolor
$Petal.Width:num0.20.20.20.20.20.40.30.20.20.1... 与virginica三种。
$Species:Factorw/3levelssetosa,versicolor,..:111111
1111...
ggplot画图 第 1章引言 6
library(ggplot2)#加载包含ggplot()地包
ggplot(data=iris)+geom_point(aes(x=Petal.Len
gth,y=Petal.Width,
color=Species,shape=Species),position=
jitter)
l 150个样本中,每个类别各有50个样本,用不同地颜色表示。
l 可以看出,不同类别地样本距离较远,同一类别地样本彼此
接近。
选择合适地特征与距离度量 第 1章引言 7
ggplot(data=iris)+geom_point(aes(x=Sepal.Le
ngth,y=Sepal.Width,color=Species,shape=Speci
es),position=jitter)
l 再以花萼地长度(Sepal.Le
您可能关注的文档
- Python语言函数与模块.pdf
- Python语言学生成绩管理系统的设计与实现.pdf
- Python自然语言理解和文本挖掘.pdf
- R语言基础与数据科学应用-程序设计基础.pdf
- R语言基础与数据科学应用-绘图与数据可视化.pdf
- R语言基础与数据科学应用-类与对象.pdf
- R语言基础与数据科学应用-数据结构与数据处理.pdf
- Rancher自动化部署教学模板.pdf
- Python语言基础教学模板.pdf
- Python数据可视化教学模板.pdf
- GB/T 9706.266-2025医用电气设备 第2-66部分:助听器及助听器系统的基本安全和基本性能专用要求.pdf
- 中国国家标准 GB/T 9706.266-2025医用电气设备 第2-66部分:助听器及助听器系统的基本安全和基本性能专用要求.pdf
- GB/T 21715.2-2025健康信息学 患者健康卡数据 第2部分:通用对象.pdf
- 中国国家标准 GB/T 21715.2-2025健康信息学 患者健康卡数据 第2部分:通用对象.pdf
- 《GB/T 21715.2-2025健康信息学 患者健康卡数据 第2部分:通用对象》.pdf
- 《GB/T 31455.6-2025快速公交(BRT)智能系统 第6部分:调度中心与场站站台控制系统通信数据接口规范》.pdf
- GB/T 31455.6-2025快速公交(BRT)智能系统 第6部分:调度中心与场站站台控制系统通信数据接口规范.pdf
- 中国国家标准 GB/T 31455.6-2025快速公交(BRT)智能系统 第6部分:调度中心与场站站台控制系统通信数据接口规范.pdf
- 中国国家标准 GB 24407-2025专用校车安全技术条件.pdf
- GB 24407-2025专用校车安全技术条件.pdf
最近下载
- 心理健康六年级《小学生心理健康素养提升:情绪管理与人际交往》教学设计.docx VIP
- 【管理咨询宝藏58】某大型央企地产员工敬业度分析报告.pdf
- 2024公路工程养护施工安全管理技术规范.pdf VIP
- 信息可视化设计 课件 4.1时间信息可视化定义.pptx
- 儿科抢救流程图.docx
- 《全国建筑设计行业收费标准》的通知.pdf VIP
- OTIS奥的斯XIOTIS西子奥的斯GEN2_Comfort_New电梯调试培训_电气.pptx VIP
- 地铁车站设计.docx VIP
- 宝可梦 Let's Go!皮卡丘1.02版switch大气层系统游戏修改代码.docx VIP
- 2026年全年党建工作计划.docx VIP
原创力文档

文档评论(0)