Python机器学习:数据建模与分析(第2版).pptxVIP

Python机器学习:数据建模与分析(第2版).pptx

  1. 1、本文档共284页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第1章 机器学习概述;符号主义人工智能:基于“一切都可规则化编码”的基本信念:通过硬编码,依指定规则自动完成相应的处理任务 例:依据BMI判断肥胖 棋类对弈程序 专家系统(没有常识的专家系统是没有意义的) 符号主义人工智能(弱人工智能)很难解决没有明确规则定义的问题(诸如语言翻译、语音识别、图像分类等) 不能仅依据BMI对肥胖进行判断;机器学习的发展:人工智能中的机器学习? ? ;机器学习的核心:数据和数据建模? ? ;机器学习的核心:数据和数据建模? ? ;机器学习的核心:数据和数据建模? ? ;机器学习的核心:数据和数据建模? ? ;机器学习的核心:数据和数据建模? ? ;机器学习的核心:数据和数据建模? ? ;第2章 机器学习中的Python基础;Python:机器学习的首选工具 ;Python的集成开发环境:Anaconda ;Python的集成开发环境:Anaconda ;Jupyter Notebook的使用: 1984年提出的文字表达化编程形式的具体体现 是一个基于网页的交互式笔记本;扩展名为.ipynb的JSON格式文件;Python第三方包的引用;?;NumPy(Numerical Python)使用示例:最常用的 Python 包。特点: 第二,拥有丰富的数学运算和统计函数 ;NumPy(Numerical Python)使用示例:最常用的 Python 包。特点: 第二,拥有丰富的数学运算和统计函数 ;Pandas(Python data analysis)使用示例: 提供了快速便捷组织和处理结构化数据的数据结构和大量功能丰富的函数。特点: 基于NumPy构建: 序列(Series):对应1维数组 数据框(DataFrame):对应2维表格型数据结构,也称数据框为序列的容器 Pandas数据框是存储机器学习数据集的常用形式 Pandas的索引 ;Pandas的数据框;Pandas的数据加工处理;NumPy和Pandas的综合应用:空气质量监测数据的预处理和基本分析;基本分析;派生虚拟自变量;抽取数据子集;AQI的时序变化特点;第3章 数据预测与预测建模;导言 ;从线性回归预测模型说起 ;从线性回归预测模型说起 ;从线性回归预测模型说起 ;从线性回归预测模型说起 ;Python模拟:可通过增加模型的复杂度减少模型的预测误差;Logistic回归预测模型:分类预测模型 仅讨论二分类预测模型,多分类预测可通过多个二分类预测实现 再看一般线性回归模型 对响应概率建模,称为:一般线性概率模型 一般线性概率模型的不足: 无法保证模型给出的概率值限制在0-1范围内 线性概率模型反映了概率与自变量取值之间的线性而非一般经验上的非线性关系 例:收入和购买某奢侈品的概率;Logistic回归预测模型:二分类预测模型;Logistic回归预测模型:二分类预测模型;认识线性分类预测模型 ;Python应用实践:空气质量等级预测 建立简单二分类预测模型;Python应用实践:空气质量等级预测 建立简单二分类预测模型 模型的评价;认识线性分类预测模型 ;?;Python应用实践:空气质量等级预测 建立较复杂的二分类预测模型;预测模型的评价---模型的图形化评价工具 ;Python应用实践:空气质量等级预测 ROC曲线和AUC值;PR曲线;?;提高预测精度 从直线到曲线,从平面到曲面;?;?;?;参数解空间和搜索策略 参数的最小二乘估计 损失函数L是模型参数的非负二次函数;参数解空间和搜索策略 在预测模型参数解空间中,采用一定的搜索策略估计参数;预测模型的选择 ;预测模型的选择 ;预测模型的选择 ;预测模型的选择 ;Python模拟和启示 ;Python模拟和启示:训练误差和测试误差的特点;预测模型的选择 ;预测模型的选择 ;预测模型的选择 ;预测模型的选择问题 ;?;第4章 数据预测建模:贝叶斯分类器;贝叶斯概率和贝叶斯法则 ;?;贝叶斯分类器 例如:对性别等于1、年龄段为A的顾客是否购买进行预测;贝叶斯和朴素贝叶斯分类器 ;Python模拟:认识贝叶斯分类器的分类边界;贝叶斯分类器的应用:空气质量等级的贝叶斯分类;贝叶斯分类器的应用:法律裁判文书中的案情要素分类 以“中国裁判文书网”公开的有关婚姻家庭领域的2665条裁判文书为例,基于文书句子文本和每个句子对应的要素标签(多分类),探索朴素贝叶斯分类器在文本分类中的应用 Python文本数据的预处理:文本分词和量化计算 分词:将句子分割成若干个词,该过程称为分词 结巴(jieba)是使用较为普遍的Python中文分词组件之一;?;词的量化;Python文本描述性分析:词云图和文本相似性;Python文本分析综合应用:裁判文书的要素提取 文本和文本标签的组织:通常采用JSON格式组

文档评论(0)

139****1983 + 关注
实名认证
文档贡献者

副教授、一级建造师持证人

一线教师。

领域认证该用户于2023年06月21日上传了副教授、一级建造师

1亿VIP精品文档

相关文档