python scikit-learn学习笔记.pdf

  1. 1、本文档共50页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
python scikit-learn学习笔记

简介: 2 主要特点: 2 scikit-learn 安装:(ubuntu 版本14.04.1) 2 Classification 2 1.监督学习 2 1.1 广义线性模型: 2 1.2 支持向量机 9 1.3 随机梯度下降 10 1.4 最近邻 10 1.5 Gaussian Processes 15 1.6 Cross decomposition 16 1.7 Naive Bayes 16 1.8 Decision Trees 17 1.9 Ensemble methods 20 1.10 Multiclass and multilabel algorithms 25 1.11 Feature selection 26 1.14 Isotonic regression 29 2. 29 2.3 Clustering 29 2.5 Decomposing signals in components (matrix factorization problems) 32 3.Model selection and evaluation 32 3.1 Cross-validation: evaluating estimator performance 32 3.2 Grid Search: Searching for estimator parameters 35 3.3 Pipeline: chaining estimators 37 3.4 FeatureUnion: Combining feature extractors 38 3.5. Model evaluation: quantifying the quality of predictions 38 3.6. Model persistence 42 3.7. Validation curves: plotting scores to evaluate models 43 4 44 4.2 Preprocessing data 44 4.4 Random Projection 49 简介: scikit-learn 是一个用于机器学习的Python 模块,建立在SciPy 基础之上。 主要特点: 操作简单、高效的数据挖掘和数据分析 无访问限制,在任何情况下可重新使用 建立在NumPy 、SciPy 和matplotlib 基础上 使用商业开源协议--BSD 许可证 scikit-learn 安装:(ubuntu 版本14.04.1) 安装依赖: sudo apt-get install build-essential python-dev python-numpy python-setuptools python-scipy libat las-dev libatlas3-base python-matplotlib 安装pip sudo apt-get install python-pip 安装scikit-learn sudo pip install -U scikit-learn 标准库 Classification 1.监督学习 1.1 广义线性模型: 1.1.1 普通最小二乘法: 无偏估计的 通过计算最小二乘的损失函数的最小值来求得参数得出模型 通常用在观测有误差的情况,解决线性回归问题  y (w,x) w w x w x 0 1 1 p p 求实际观测值与预测值差的平方最小值 数

文档评论(0)

138****7331 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档