- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
Python机器学习原理算法及案例实战答案--第1页
Python机器学习原理算法及案例实战答案
1、k-近邻算法:手写字符识别
通过算法训练识别字符为0-9的数字,也可以为A-Z的字符,目前sklearn
提供的数据集里面为0-9的数字。数据训练前需要用图像处理软件将数字转换成
宽高为32X32的黑白图像,然后将其变换成1x1024的向量。
2、朴素贝叶斯:垃圾邮件过滤
邮箱系统如何分辨一封Email是否属于垃圾邮件?这应该属于文本挖掘的范
畴,通常会采用朴素贝叶斯的方法进行判别。它的主要原理是,根据邮件正文中
的单词,是否经常出现在垃圾邮件中,进行判断。
3、Logistic回归:预测病马的死亡率
Logistic回归又称Logistic回归分析,是一种广义的线性回归分析模型,常用
于数据挖掘,疾病自动诊断,经济预测等领域。使用Logistic回归来预测患疝气
病的马的存活问题是一个典型的案例,项目数据集包含了医院检测马疝病的368
个样本和28个特征,有的指标比较主观,有的指标难以测量。
4、基于协同过滤:菜肴推荐引擎
构建一个推荐系统,该系统可以像一个人推荐去哪儿吃饭和菜品推荐,解决
人们选择饭店和不知道点什么菜的问题。这个系统能够寻找用户没有尝过的菜
肴,预估用户对该菜品的评分,然后通过SVD来减少特征空间并提高推荐效果。
5、基于异常值分析:支付中的交易欺诈侦测
采用支付宝支付时,或者刷信用卡支付时,系统会实时判断这笔刷卡行为是
否属于盗刷。通过判断刷卡的时间、地点、商户名称、金额、频率等要素进行判
断。这里面基本的原理就是寻找异常值。如果您的刷卡被判定为异常,这笔交易
Python机器学习原理算法及案例实战答案--第1页
Python机器学习原理算法及案例实战答案--第2页
可能会被终止。
异常值的判断,应该是基于一个欺诈规则库的。可能包含两类规则,即事件
类规则和模型类规则。第一,事件类规则,例如刷卡的时间是否异常(凌晨刷卡)、
刷卡的地点是否异常(非经常所在地刷卡)、刷卡的商户是否异常(被列入黑名
单的套现商户)、刷卡金额是否异常(是否偏离正常均值的三倍标准差)、刷卡
频次是否异常(高频密集刷卡)。第二,模型类规则,则是通过算法判定交易是
否属于欺诈。一般通过支付数据、卖家数据、结算数据,构建模型进行分类问题
的判断。
6、决策树:预测隐形眼镜的类型
预测隐形眼镜的类型是决策树分类问题中的一个案例。隐形眼镜数据集是非
常著名的数据集,它包含了很多患者眼部状况的观察条件以及医生推荐的隐形眼
镜类型。隐形眼镜类型包括硬材质、软材质以及不适合佩戴隐形眼镜。数据中采
用的特征有四个:age(年龄)、prescript(症状)、astigmatic(是否散光)、tearRate
(眼泪数量)。
7、Apriori算法关联分析:发现毒蘑菇的相似特征
Apriori算法关联分析是从大规模数据集中寻找物品间的隐含关系。通过分析
寻找毒蘑菇的公共特征,利用这些特征就能避免迟到有毒的蘑菇。所提供的数据
集合重有蘑菇的23种特征的数据集,每一个特征是标称数据。而我们需要将样
本转换成特征的集合,枚举每个特征所有可能的举止,如果某个样本包含特征,
那么特征对应的整数应该被包含在数据集中,每一个样本都是这样的特征集合。
如果第一个特征有毒就是2,如果能食用就是1,下一个特征是形状有6可能值,
用整数3-8表示,相当于把需要的特征维度都进行排列离散化。最终只有一个大
Python机器学习原理算法及案例实战答案--第2页
Python机器学习原理算法
您可能关注的文档
- XX第X医学院非学历继续教育培训管理办法.pdf
- XX市台办对台工作典型经验交流材料.pdf
- XX医院危重孕产妇救治实施方案.pdf
- XX中小学实施《中小学德育工作指南》测评细则量化评分表.pdf
- XXX县交通运输局重大工程建设项目社会稳定风险评估实施方案.pdf
- XXX《计算机应用基础(本)》形考任务三国家开放大学试题答案.pdf
- XXXX小区业主大会议事规则表决版.pdf
- WPS练习题_原创精品文档.pdf
- Web开发中的错误处理与调试技巧.pdf
- vue 循环生成wangeditor富文本编译-概述说明以及解释.pdf
- 2024高考物理一轮复习规范演练7共点力的平衡含解析新人教版.doc
- 高中语文第5课苏轼词两首学案3新人教版必修4.doc
- 2024_2025学年高中英语课时分层作业9Unit3LifeinthefutureSectionⅢⅣ含解析新人教版必修5.doc
- 2024_2025学年新教材高中英语模块素养检测含解析译林版必修第一册.doc
- 2024_2025学年新教材高中英语单元综合检测5含解析外研版选择性必修第一册.doc
- 2024高考政治一轮复习第1单元生活与消费第三课多彩的消费练习含解析新人教版必修1.doc
- 2024_2025学年新教材高中英语WELCOMEUNITSectionⅡReadingandThi.doc
- 2024_2025学年高中历史专题九当今世界政治格局的多极化趋势测评含解析人民版必修1.docx
- 2024高考生物一轮复习第9单元生物与环境第29讲生态系统的结构和功能教案.docx
- 2024_2025学年新教材高中英语UNIT5LANGUAGESAROUNDTHEWORLDSect.doc
最近下载
- 基于UML的大学图书馆图书信息管理系统设计实验.docx VIP
- 推土机安全作业操作规程技术交底培训.pptx VIP
- BYK技术手册_润湿分散剂.pdf
- 最新GBT20647.9物业服务管理体系一整套文件(手册+程序文件+管理制度+表单).pdf
- 关于续签2017年度物业管理服务项目合同的请示1-12月-.doc VIP
- 一例二型糖尿病患者个案护理.pptx
- 幼儿教育课题申报书:《幼儿劳动养成教育的培养研究》.docx
- 2022年道德与法治新课标《义务教育道德与法治课程标准(2022年版)》解读PPT课件.pptx VIP
- 五年级上册平行四边形的面积说课之课件.ppt
- 房屋装修监管难痛点与策略.doc
文档评论(0)