机器学习第一次作业_加水印.pdf

机器学习第一次作业

1数据集介绍

1.1分类任务数据集

分类任务中所用的数据集为鸢尾花数据集。iris数据集是经典且非常容易

的多类分类数据集。如图1所示,鸢尾花数据集样本总数为150个,有4个维度,

有3类。

图1:鸢尾花数据集总体特征

图2:鸢尾花数据集详细信息

1

如图2所示,4个维度分别为:花萼长度、花萼宽度、花瓣长度、花瓣宽度;

3类分别为:山鸢尾、变色鸢尾、维吉尼亚鸢尾。

分类任务旨在利用特定的分类算法,预测鸢尾花的种类。

1.2回归任务数据集

在1.3.2最新版本的scikit-learn中,波士顿房价数据集已经停止使用,因此

本实验选取了加利福尼亚房价数据集。如图3所示,加利福尼亚房价数据集样本

总数为20640个,维度为8,目标的范围为[0.15,5]。

图3:加利福尼亚房价数据集总体特征

如图4所示,样本的8个维度分别为:MedInc,HouseAge,AveRo

文档评论(0)

1亿VIP精品文档

相关文档