计算金融与 Python 实践10 数据分析 sklearn 机器学习库.pptxVIP

  • 1
  • 0
  • 约1.01万字
  • 约 52页
  • 2026-04-07 发布于山东
  • 举报

计算金融与 Python 实践10 数据分析 sklearn 机器学习库.pptx

数据分析sklearn机器学习库10

数据分析基础要求理解数据分析的基本概念,掌握数据分析的基本方法,搭建学习的核心理论基础。sklearn工具应用掌握使用sklearn进行简单数据预处理、模型构建及模型评估的基本操作方法。【学习目标】

【课前导引】Iris数据集与降维应用Iris数据集含4个鸢尾花属性变量,用sklearn的PCA降维后可二维可视化区分3类鸢尾花。sklearn工具库介绍sklearn是基于Python的开源机器学习工具库,含多种算法模型、自带数据集,集成多类工具。

模块数据集:三类数据获取方法本地小数据集获取sklearn本地小数据集可通过load_*()方法直接获取,无需处理即可用于模型训练,如iris、boston、wine等数据集。大型数据集获取可通过联网调用fetch_*()通用格式方法下载大型数据集,例:用fetch_20newsgroups下载新闻组数据集。自定义数据集生成make_*()方法可按给定参数生成数据集,如make_blobs()可生成含两特征值的100个样本。数据集获取方法分类sklearn.datasets模块包含3类获取数据的方法。

模块数据集数据集字典键说明数据集字典含必选键data、target,及可选键feature_names、target_names、DESCR,各键对应特定内容。示例代码说明示例代

文档评论(0)

1亿VIP精品文档

相关文档