- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Sklearn库介绍
1. 总结机器学习基本概念2. 了解 scikit-learn 基本概念3. 了解 sklearn 基本算法类型
机器学习概念总结scikit-learn 介绍12sklearn 算法介绍3
1. 机器学习概念总结机器学习解决的问题包含建立预测模型,根据观测值分类,或是在未分类数据上学习潜在模式机器学习的算法一般分为监督学习算法和无监督学习算法训练集与测试集机器学习所使用的数据集一般分为训练集与测试集模型在训练集上学习数据的模式,并在测试集上验证模型效果
1. 机器学习概念总结监督学习算法 supervised learning一般用于学习两个数据集之间的关系,观测集X 与 目标集 Y,预测结果通常称为 target 或 labels分类算法 是从已分类的数据中学习预测未分类数据的模式,预测的目标值是离散的回归算法 预测的目标值是连续的无监督学习算法 unsupervised learning通常用于未分类的数据,无监督学习也可用于数据降维聚类算法 clustering 用于将相似的数据分组密度估计 density estimation 进一步分析数据的分布 distribution
2. scikit-learn介绍scikit-learn简称sklearn包含了从数据预处理到训练模型的各个方面支持包括分类、回归、降维和聚类四大机器学习算法还包含了特征提取、数据处理和模型评估三大模块sklearn是Scipy的扩展,建立在NumPy和matplotlib库的基础上,利用这几大模块的优势,可以大大提高机器学习的效率sklearn对一些常用的机器学习方法进行了封装可以极大的节省编写代码的时间以及减少代码量可以有更多的精力去分析数据分布,调整模型和修改超参
3. sklearn 算法介绍应用示例(Applications)算法举例(Algorithm)分类(Classfication)异常检测,图像识别等KNN,SVM,贝叶斯,决策树聚类(Clustering)图像分隔,群体划分等K-Means,谱聚类,层次聚类回归(Regression)价格预测,趋势预测等线性回归,SVR,岭回归,Lasso回归降维(Dimension Reduction)特征工程,可视化等PCA,NMF,TF-IDF,矢量量化数据压缩
3. sklearn 算法介绍除了分类和回归问题,Scikit-Learn还有海量的更复杂的算法,包括了聚类,以及建立混合算法的实现技术,如 Bagging 和 Boosting同时sklearn内置了大量数据集,节省了获取和整理数据集的时间
1. 机器学习基本概念2. scikit-learn 基本概念3. sklearn 基本算法类型
文档评论(0)