Sklearn常用机器学习算法参数详解.PDFVIP

  • 10
  • 0
  • 约4.23万字
  • 约 23页
  • 2020-04-11 发布于山东
  • 举报
Sklearn常用机器学习算法参数详解.PDF

Sklearn常用机器学习算法参数详解 更新日期:2019-08-17 讲师简介:菊安酱,CDA数据分析师讲师   Sklearn常用机器学习算法参数详解 线性回归 岭回归 Lasso回归 Elastic Net 逻辑回归 sv m.LinearSVC sv m.SVC sv m.LinearSV R sv m.SV R K近邻分类器 K近邻回归 决策树 (回归树) 决策树 (分类树) GBDT分类器 GBDT回归器 随机森林分类器 随机森林回归器 xgboost分类器 xgboost回归器 菊安酱 CDA数据分析师 1/23 线性回归 from sklearn.linear_model import LinearRegression LinearRegression(fit_intercept True,normalize False,copy_X True,n_jobs 1) 参数含义: 1.fit_intercept:布尔值,指定是否需要计算线性回归中的截距,即b值。如果为False,那么不计算b 值。 2.normalize:布尔值。如果为False,那么训练样本会进行归一化处理。 3.copy_X:布尔值。如果为True,会复制一份训练数据。 4.n_jobs:一个整数。任务并行时指定的CPU数量。如果取值为-1则使用所有可用的CPU。 属性 1.coef_ :权重向量 2.intercept_ :截距b值 方法: 1.fit(X ,y):训练模型。 2.predict(X):用训练好的模型进行预测,并返回预测值。 3.score(X ,y):返回预测性能的得分。计算公式为:score (1 - u/v) 其中u ((y_true - y_pred) ** 2).sum(),v ((y_true - y_true.mean()) ** 2).sum() score最大值是1,但有可能是负值(预测效果太差)。score越大,预测性能越好。   菊安酱 CDA数据分析师 2/23 岭回归 # 加入L2正则化的线性回归 from sklearn.linear_model import Ridge Ridge(alpha 1.0, fit_intercept True, normalize False,copy_X True, max_iter None, tol 1e-3, solver auto,random_state

文档评论(0)

1亿VIP精品文档

相关文档