- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
Python数据挖掘与机器学习实战-选题
Python数据挖掘与机器学习实战—选题大纲(一组一章,第一章
除外)
或从下列选题中选择:(除第1讲)
选题名称内容结构内容要求
第1讲
机器学习与Python库(该讲不可选)解释器Python3.6与IDE:
Anaconda/Pycharm
1.Python基础:列表/元组/字典/类/文件
2.numpy/scipy/matplotlib/panda
的介绍和典型使用
3.多元高斯分布
4.典型图像处理
5.scikit-learn的介绍和典型使用
6.多种数学曲线
7.多项式拟合
8.快速傅里叶变换FFT
9.奇异值分解SVD
10.Soble/Prewitt/Laplacian算子
与卷积网络
代码和案例实践
1.卷积与(指数)移动平均线
2.股票数据分析
3.实际生产问题中算法和特征的关系
4.缺失数据的处理
5.环境数据异常检测和分析
第2讲回归线性回归
1.Logistic/Softmax回归
2.广义线性回归
3.L1/L2正则化
4.Ridge与LASSO
5.ElasticNet
6.梯度下降算法:BGD与SGD
7.特征选择与过拟合
8.Softmax回归的概念源头
9.最大熵模型
10.K-L散度
代码和案例实践
1.股票数据的特征提取和应用
2.泰坦尼克号乘客缺失数据处理和存活率
预测
3.环境检测数据异常分析和预测
4.模糊数据查询和数据校正方法
5.PCA与鸢尾花数据分类
6.二手车数据特征选择与算法模型比较
7.广告投入与销售额回归分析
8.鸢尾花数据集的分类
第3讲
决策树和随机森林熵、联合熵、条件熵、KL散度、互信息
1.最大似然估计与最大熵模型
2.ID3、C4.5、CART详解
3.决策树的正则化
4.预剪枝和后剪枝
5.Bagging
6.随机森林
7.不平衡数据集的处理
8.利用随机森林做特征选择
9.使用随机森林计算样本相似度
10.异常值检测
代码和案例实践
1.随机森林与特征选择
2.决策树应用于回归
3.多标记的决策树回归
4.决策树和随机森林的可视化
5.社会学人群收入预测
6.葡萄酒数据集的决策树/随机森林分类
7.泰坦尼克乘客存活率估计
第4讲SVM线性可分支持向量机
1.软间隔
2.损失函数的理解
3.核函数的原理和选择
4.SMO算法
5.支持向量回归SVR
6.多分类SVM
代码和案例实践:
1.原始数据和特征提取
2.调用开源库函数完成SVM
3.葡萄酒数据分类
4.数字图像的手写体识别
5.MNIST手写体识别
6.SVR用于时间序列曲线预测
7.SVM、Logistic回归、随机森林三者的
横向比较
第5讲聚类各种相似度度量及其相互关系
1.Jaccard相似度和准确率、召回率
2.Pearson相关系数与余弦相似度
3.K-means与K-Medoids及变种
4.AP算法(Sci07)/LPA算法及其应用
5.密度聚类DBSCAN/DensityPeak(Sci14)
6.谱聚类SC
7.聚类评价和结果指标
代码和案例实践:
1.K-Means++算法原理和实现
2.向量量化VQ及图像近似
3.并查集的实践应用
4.密度聚类的异常值检测
5.谱聚类用于图片分割
第6讲
隐马尔科夫模型
HMM主题模型LDA
1.词潜入和word2vec
2.前向/后向算法
3.HMM的参数学习
4.Baum-Welch算法详解
5.Viterbi算法详解
6.隐马尔科夫模型
您可能关注的文档
- “互联网+产业”项目财政资金申请报告 .pdf
- γ干扰素释放实验的原理 .pdf
- β-抑制蛋白1促进缺氧性肺动脉高压的肺血管胶原合成作用探讨.pdf
- α-308GA基因多态性与慢性牙周炎易感性关系的Meta分析的开题报告.pdf
- [注册化工工程师考试密押题库与答案解析]注册化工工程师专业考试分类.pdf
- ZNF580在TGF-β1调控肝癌细胞HepG2凋亡中的作用研究的开题报告.pdf
- X射线诊断设备及高压发生装置项目立项申请报告 .pdf
- xx汽车美容项目创业计划书 .pdf
- XX大型肥牛养殖基地建设项目可行性研究报告 .pdf
- XXX第一季度放射科个人放射剂量监测分析整改报告 .pdf
- 专题06 经济体制(我国的社会主义市场经济体制)-五年(2020-2024)高考政治真题分类汇编(解析版).docx
- 专题11 世界多极化与经济全球化-5年(2020-2024)高考1年模拟政治真题分类汇编(解析版).docx
- 专题03 经济发展与社会进步-5年(2020-2024)高考1年模拟政治真题分类汇编(浙江专用)(解析版).docx
- 专题09 文化传承与文化创新-5年(2020-2024)高考1年模拟政治真题分类汇编(北京专用)(原卷版).docx
- 5年(2020-2024)高考政治真题分类汇编专题08 社会进步(我国的个人收入分配与社会保障)(原卷版).docx
- 专题07 探索世界与把握规律-5年(2020-2024)高考1年模拟政治真题分类汇编(解析版).docx
- 5年(2020-2024)高考政治真题分类汇编专题06 经济体制(我国的社会主义市场经济体制)(原卷版).docx
- 专题11 全面依法治国(治国理政的基本方式、法治中国建设、全面推进依法治国的基本要求)-五年(2020-2024)高考政治真题分类汇编(解析版).docx
- 专题17 区域联系与区域协调发展-【好题汇编】十年(2015-2024)高考地理真题分类汇编(解析版).docx
- 专题01 中国特色社会主义-5年(2020-2024)高考1年模拟政治真题分类汇编(原卷版).docx
最近下载
- NB_T 31083-2016风电场控制系统功能规范.pdf
- 德兴隆_PVC胶粒_A2190072365101001_2019.4.11_REACH检测报告英文版.pdf VIP
- 输液港植入术术后护理.pptx VIP
- 血液系统疾病(西安交通大学)中国大学MOOC慕课章节测验答案(课程ID:1462060167).pdf
- GB 1499.2-2024 钢筋混凝土用钢 第2部分:热轧带肋钢筋.pdf
- 征信简版电子版PDF个人信用报告最新版2024年可编辑带水印模板.pdf
- 《高中64篇必考古诗文》.doc VIP
- Rota润唐 RTBR-601馒头面包机 馒头魔法盒说明书用户手册.pdf
- 《洋流》教学设计-优秀教案.docx
- 新人音版高中音乐必修“音乐鉴赏”《高山流水志家国——流水》说课稿.doc
文档评论(0)