网站大量收购闲置独家精品文档,联系QQ:2885784924

机器学习技术任务驱动式教程-课件 模块5 基于决策树的分类预测.pptx

机器学习技术任务驱动式教程-课件 模块5 基于决策树的分类预测.pptx

  1. 1、本文档共123页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

数据探查数据可视化数据转换决策树分类模型训练数据预测基于决策树的分类预测参考书目《机器学习技术任务驱动式教程》模块5机器学习技术

目录电脑购买预测泰坦尼克幸存乘客预测降雨预测小结习题五基于决策树的分类预测模块5机器学习技术

buy_computer.csv记录了是否会购买计算机(buys_computer)的14条人员信息的记录,包含4个特征,应用决策树算法归纳出分类规则,分析用户购买行为。详细的字段描述见下表。1.1任务描述1电脑购买预测字段字段类型允许为空标签?例子年龄int否否1收入int否否2学生int否否0信用级别int否否1是否购买int否是0注:1.年龄字段中,0表示Youth,1表示middle,2表示Senior。2.收入字段中,1表示Medium,2表示high。3.学生字段中,0表示No,1表示Yes。4.信用级别字段中,0表示fair,1表示excellent。5.是否购买字段中,0表示不买,1表示买。

1.1任务描述1)在数据探查时,将客户分为购买和不购买,分别统计特征分布。2)通过年龄、收入、学生、信用4个属性值,预测用户是否会购买电脑。3)计算模型预测的准确率。4)利用建立的决策树分类模型,预测年龄、收入、学生、信用分别为2、2、1、1的结果。任务目标1电脑购买预测

1.2任务分解import方式引入依赖的模块使用Matplotblib以柱形图、多子图饼图形式可视化样本的空间分布依赖库导入数据探查数据可视化从探查数据内容开始,经过分析数据分布,根据数据特征建立决策树分类模型,预测结果,计算预测的准确率。检查样本分布、特征/标签类型、空值、重复行、属性相互关系1电脑购买预测

1.2任务分解转换Pandas类型到Numpy类型在已知样本上训练回归模型通过相关系数找到关系不明显的特征后删除,提高线性回归模型的预测准确率数据转换模型训练降维接上模型评估根据测试集预测得到的label,跟真实label比较,计算预测准确率1电脑购买预测

1.3任务实施1.3.1依赖库导入步骤1:定义2级标题。##fontcolor=black依赖库导入/font按“SHIFT+Enter”,运行结果如下:1电脑购买预测

1.3任务实施步骤2:导入依赖库。importpandasaspdimportmatplotlibasmplimportmatplotlib.pyplotaspltfromsklearnimportmodel_selectionfromsklearn.treeimportDecisionTreeClassifier按“SHIFT+Enter”,检查输出无异常。1电脑购买预测

1.3任务实施1.3.2数据探查文件读入DataFrame对象后,需要观察不同标签的数据特征。步骤1:定义2级标题。##fontcolor=black数据探查/font按“SHIFT+Enter”,运行结果如下:1电脑购买预测

1.3任务实施步骤2:读入数据集文件到DataFrame对象。df=pd.read_csv(c:/data/titanic.csv,encoding=GBK)df.head()1电脑购买预测按“SHIFT+Enter”,运行结果如下:

1.3任务实施步骤3:数据描述。df.info()按“SHIFT+Enter”,运行结果如下:1电脑购买预测

1.3任务实施步骤4:重构是否购买字字段,如将0转换为“No”,将1转换为“Yes”。df_new=df.copy()df_new[年龄]=df_new[年龄].replace({0:Youth,1:middle,2:Senior})df_new[收入]=df_new[收入].replace({1:Medium,2:high})df_new[学生]=df_new[学生].replace({0:No,1:Yes})df_new[信用级别]=df_new[信用级别].replace({0:fair,1:excellent})df_new[是否购买]=df_new[是否购买].replace({0:No,1:Yes})df_new.head()1电脑购买预测

1.3任务实施按“SHIFT+Enter”,运行结果如下:1电脑购买预测

1.3任务实施步骤5:是否购买字段频数统计。buy_count=df_new[是否购买].value_counts()buy_count1电脑购买预测按“SHIFT+Enter”,运行结果如下:

1.3任务实施步骤6:特征数据交叉频数统计。cols=df_new.columnsx=cols[-1]ys=cols[0:-1

文档评论(0)

lai + 关注
实名认证
内容提供者

精品资料

版权声明书
用户编号:7040145050000060

1亿VIP精品文档

相关文档