Scikit-learn 使用手册中文版.pdf

  1. 1、本文档共53页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Scikit-learn 使用手册中文版

Table of Contents 绪言 1.1 有监督学习 1.2 广义线性模型 1.2.1 线性与二次判别分析 1.2.2 核岭回归 1.2.3 支持向量机 1.2.4 随机梯度下降 1.2.5 1 绪言 This book is translated from official user guide of scikit-learn. 2 有监督学习 3 广义线性模型 1.1. 广义线性模型 英文原文 以下介绍的方法均是用于求解回归问题 ,其 目标值预计是输入变量的一个线性组合 。写成数 学语言为 :假设 是预测值 ,则有 在本节中 ,称向量 为 coef_ ,{% math %}w0{% endmath %}为 `intercept` 若要将通用的线性模型用于分类问题 ,可参见Logistic回归 1.1.1 普通最小二乘法 LinearRegression 使用系数 拟合一个线性模型 。拟合的目标是要将线性 逼近预测值 ( )和数据集中观察到的值 ( )两者之差的平方和尽量降到最小 。写成数学 公式 ,即是要解决以下形式的问题 4 广义线性模型 LinearRegression 的 fit 方法接受数组X和y作为输入 ,将线性模型的系数 存在成员变 量 coef_ 中 : from sklearn import linear_model clf linear_model.LinearRegression() clf.fit ([[0, 0], [1, 1], [2, 2]], [0, 1, 2]) LinearRegression(copy_X True, fit_intercept True, n_jobs 1, normalize False) clf.coef_ array([ 0.5, 0.5]) 需要注意的是 ,普通最小二乘法的系数预测取决于模型中各个项的独立性 。假设各个项相 关 ,矩阵 的列总体呈现出线性相关 ,那么 就会很接近奇异矩阵 ,其结果就是经过最小二 乘得到的预测值会对原始数据中的随机误差高度敏感 ,从而每次预测都会产生比较大的方 差 。这种状况称为重共线性 。例如 ,在数据未经实验设计就进行收集时就会发生重共线性 。 线性回归的例子 普通最小二乘法的复杂度 此方法使用 的奇异值分解来求解最小二乘 。如果 是 矩阵 ,则算法的复杂度为 ,假设 。

文档评论(0)

jiupshaieuk12 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6212135231000003

1亿VIP精品文档

相关文档