机器学习第一次作业
1数据集介绍
1.1分类任务数据集
分类任务中所用的数据集为鸢尾花数据集。iris数据集是经典且非常容易
的多类分类数据集。如图1所示,鸢尾花数据集样本总数为150个,有4个维度,
有3类。
图1:鸢尾花数据集总体特征
图2:鸢尾花数据集详细信息
1
如图2所示,4个维度分别为:花萼长度、花萼宽度、花瓣长度、花瓣宽度;
3类分别为:山鸢尾、变色鸢尾、维吉尼亚鸢尾。
分类任务旨在利用特定的分类算法,预测鸢尾花的种类。
1.2回归任务数据集
在1.3.2最新版本的scikit-learn中,波士顿房价数据集已经停止使用,因此
本实验选取了加利福尼亚房价数据集。如图3所示,加利福尼亚房价数据集样本
总数为20640个,维度为8,目标的范围为[0.15,5]。
图3:加利福尼亚房价数据集总体特征
如图4所示,样本的8个维度分别为:MedInc,HouseAge,AveRo
原创力文档

文档评论(0)