- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Sklearn 一般流程
1. 了解 sklearn 通用学习模式2. 熟悉 sklearn 载入数据集过程3. 熟悉 sklearn 模型训练与预测步骤
sklearn 通用学习模式sklearn 载入数据集12sklearn 模型训练与预测3
1. sklearn通用学习模式sklearn通用学习模式scikit-learn 实现的主要API就是各种估计模型,提供了各种机器学习算法的接口,每个算法的调用就像一个黑箱,只需要根据自己的需求,设置相应的参数首先引入需要训练的数据然后选择相应机器学习方法进行训练,scikit-learn 每个模型都提供一个 fit(X, Y) 接口函数,用于 模型训练,模型通过 fit() 函数估计出的参数在模型的属性中以下划线 _ 结尾模型训练完成之后便可预测新数据,还可以通过可视化方法来直观的展示数据,模型预测使用 predict(T) 函数另外还可以将已训练好的Model进行保存,方便移动到其他平台,不必重新训练
2. sklearn 载入数据集scikit-learn 内包含了常用的机器学习数据集,比如做分类的 iris 和 digit 数据集,用于回归的经典数据集 Boston house prices鸢尾花 iris 数据集,是一类多重变量分析的数据集,通过花瓣petal 与 萼片sepal 的长宽,划分鸢尾花的三个种类 山鸢尾Setosa / 杂色鸢尾Versicolour / 维吉尼亚鸢尾Virginica。
2. sklearn 载入数据集scikit-learn 载入的数据集是以类似于字典的形式存放的,该对象中包含了所有有关该数据的数据信息数据值统一存放在.data的成员中,是一个 (n_samples, n_features)二维数据,iris数据中每个实例有4维特征对于监督学习,比如分类问题,数据对应的分类结果存在.target成员中
3. sklearn 模型训练与预测使用分类器训练模型的一般步骤导入模块创建数据建立模型模型训练模型预测模型评估
3. sklearn 模型训练与预测
1. sklearn 通用学习模式2. sklearn 载入数据集过程3. sklearn 模型训练与预测步骤
文档评论(0)