Python快乐编程——数据分析与实战 课件 第9章 ScikitLearn数据建模.pptx

Python快乐编程——数据分析与实战 课件 第9章 ScikitLearn数据建模.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第9章 Scikit-Learn数据建模数据建模的基本概述回归模型的应用与评价NLTK的基本介绍和使用聚类模型的应用与评价分类模型的应用与评价数据建模的基本概述聚类模型的应用与评价回归模型的应用与评价分类模型的应用与评价9.29.39.49.1?点击查看本小节知识架构?点击查看本小节知识架构?点击查看本小节知识架构?点击查看本小节知识架构学习目标掌握回归模型的创建与评价掌握数据建模的基本流程掌握掌握3214掌握掌握分类模型的创建与评价掌握掌握聚类模型的创建与评价在 21 世纪的今天,我国的综合国力不断提升,科技水平成为现代衡量国家力量的重要指标。近年来,我国在 AI 领域的科技水平迅速发展,促进了国防科技的更新换代, AI 科技在国际竞争中的地位可见一斑。 Scikit-Learn 是 AI 入门的必学之器,学好 Scikit-Learn 为祖国 AI 事业做贡献是必然之事。9.1 数据建模的基本概述返回目录Scikit-learn的基本介绍9.1.1数据建模的基本流程9.1.29.1.1 Scikit-Learn的基本介绍作为 GitHub 上排名第二的 Python 机器学习项目, Scikit-Learn 具有分类、回归、聚类、数据降维、模型选择、数据处理六大功能。 Scikit-Learn 库是基于科学计算领域的 SciPy 包开发,该包是 SciPy 在机器学习领域的定制包。 SciPy 具有许多领域的分支包,通常将所有领域的包的集合称为 Scikits ,即 SciPy 工具包的集合。 Scikit-Learn 本身并不支持深度学习,同时不支持 GPU 加速。Scikit-Learn (以下 简称 sklearn )中具有 用 于 监 督 学 习 和 无 监 督 学 习 的 基 本 方 法。sklearn 中的函数大致可以分为两类,分别是估计器和转换器。估计器就是模型,用于对数据的预测和回归;转换器用于对数据的处理,如标准化、数据降维及特征选择等。9.1.1 Scikit-Learn的基本介绍估计器通常具有三个函数,分别是 fit ()、socre ()和 predict ()函数。 fit ()函数通常为可训练模型;socre ()函数多用于对模型的评分;predict ()函数用于对数据的预测,并输出预测标签。转换器通常具有三个函数,分别是 fit ()、transform ()、 fit _ transform ()。 fit ()函数用于计算数据变换方式;transform ()根据已经计算的变换方式,计算数据的变换结果;fit _tramsform ()函数用于计算出数据变换方式之后对输入数据进行就地转换。9.1.2数据建模的基本流程sklearn 作为数据建模的利器,在使用过程中会经过如下步骤:数据集加载、数据集划分、数据集预处理、数据模型评估。下面将对这几个步骤分别进行介绍。1.数据集加载数据集加载是将已知的数据源加载到当前工程的内存环境中,供数据预处理与数据建模使用。当然,开发者也可以根据自己的实际需求,调整数据集的大小等相关属性。9.1.2数据建模的基本流程sklearn 库中集成了 datasets 模块,该 模块中包含 数据分析中 常用的经典 数据集。datasets 模块中常用的数据集加载函数具体如表所示。9.1.2数据建模的基本流程sklearn 同时支持加载实际的数据集,相对上述数据集而言,实际数据集可靠性更强,数据量更大,实际数据集的加载函数具体如表所示。9.1.2数据建模的基本流程除此之外,sklearn 同时支持加载外部数据集,加载外部数据集主要通过 pandas.io 加载CSV 、 Excel 、 JSON 、 SQL 等类型的数据;通过 scipy.io 可以加载 .mat 、 .arff 格式的数据;除了文本数据外,sklearn 支持使用 skimage.io 或者 Imageio 加载图像或者视频数据,并将数据处理为 NumPy 的数据类型数据;通过 scipy.io.wavfile.read ()函数读取 WAV 形式的音频数据。开发者可以使用 datasets 数据集进行相关数据的导入,具体代码如下。9.1.2数据建模的基本流程上述代码从 datasets 模块中导入 load _ iris ()函数,通过调用该函数实现数据集的加载。数据加载后,可认为是一个字典形式的数据,可以查看其元素个数。但是数据类型并非字典类型,而是 sklearn 中的 Bunch 类型,具体代码如下。当然,开发者可以通过 Python 自带的 dir ()函数查看 iris 对象的基本属性,一般来说,该对象的属性由 DESCR 、 data 、feature _ names 、

文档评论(0)

balala11 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档