机器学习之决策树在sklearn中的实现.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

机器学习之决策树在sklearn中的实现

小伙伴们大家好~o( ̄▽ ̄)ブ,首先声明一下,我的开发环境是Jupyterlab,所用的库和版本大家参考:

Python3.7。1(你的版本至少要3。4以上

Scikit-learn0.20。0(你的版本至少要0.20

Graphviz0。8。4(没有画不出决策树哦,安装代码condainstallpython-graphviz

Numpy1。15.3Pandas0.23。4Matplotlib3.0.1SciPy1.1.0

用SKlearn建立一棵决策树

这里采用的数据集是SKlearn中的红酒数据集。

1导入需要的算法库和模块

〈prespellcheck=”falseclass=md-fencesmd-end—blockty-contain—cmmodeLoaded

lang=Python”contenteditable=true”cid=”n11mdtype=fences”〉fromsklearnimport

tree#导入tree模块

fromsklearn.datasetsimportload_wine#导入红酒数据集

fromsklearn。model_selectionimporttrain_test_split#导入训练集和测试集切分包〈/pre〉

2探索数据

〈prespellcheck=falseclass=”md—fencesmd-end-blockty-contain-cmmodeLoaded

lang=”pythoncontenteditable=true”cid=”n13”mdtype=”fences〉wine=

load_wine()

wine。data

wine。data.shape

机器学习之决策树在sklearn中的实现

wine.target

wine。target.shape〈/pre〉

运行的结果是这样子的:

data就是该数据集的特征矩阵,从运行结果可以看出,该红酒数据集一共有178条记录,13个特征。

特征矩阵中有178条记录,相对应的标签Y就有178个数据。

如果wine是一张表,应该长这样:

prespellcheck=false”class=”md-fencesmd—end-blockty-contain-cmmodeLoaded

lang=”Python”contenteditable=”true”cid=”n20mdtype=”fences〉importpandasas

pd

机器学习之决策树在sklearn中的实现

pd.concat([pd.Datafrxxxxame(wine。data)pd。Datafrxxxxame(wine.target)]axis=1)

〈/pre

机器学习之决策树在sklearn中的实现

机器学习之决策树在sklearn中的实现

这是数据集特征列名和标签分类

〈prespellcheck=”false”class=md—fencesmd—end—blockty—contain-cmmodeLoaded

lang=”python”contenteditable=true”cid=”n23mdtype=fences”〉wine.feature_names

wine.target_names〈/pre

3分训练集和测试集

这里选取30%作为测试集。切分好之后,训练集有124条数据,测试集有54条数据。

prespellcheck=”false”class=”md-fencesmd—end—blockty-contain-cmmodeLoaded

lang=”Python”contenteditable=truecid=”n28mdtype=”fences”XtrainXtestYtrain

Ytest=train_tes

文档评论(0)

152****5753 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档