- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
The name of the DepartmentBeijing Forest Studio
北京理工大学信息系统及安全对抗实验中心部门名称
数据挖掘项目实战
Titanic: Machine Learning from Disaster
郝靖伟 硕士研究生
2018年05月01日
1
内容提要
• 背景简介
• 总体思路
• 实战演练
• 参考文献
2
数据挖掘项目实战
背景简介
3
背景简介
什么是kaggle?
Google :
Kaggle is a platform for predictive modelling and analytics
competitions in which statisticians and data miners compete to
produce the best models for predicting and describing the
datasets uploaded by companies and users.
• 1.Find a competition
• For learning
• For prizes and points
• 2.Build your model
• 3.Submit your entry
4
背景介绍
• Kaggle网址:
• 入门比赛:
– Getting Started
– Playground
• 比赛类型:
– 传统Business
– 图像识别AI
• 相关教程:
– Code: R, Python
– Data analysis and visualization
– Statistics
5
背景介绍
应用层 搜索 无人驾驶 ...
技术层 机器学习算法
云计算 大数据
基础层
购物数据 交通数据 ...
6
数据挖掘项目实战
总体思路
7
总体思路
1 2 3 4 5 6
提出问题 理解数据 数据清洗 构建模型 模型评估 方案实施
有监督学习问题, 对数据、需求或
还是无监督问题? 目标进行分析, 如
原创力文档


文档评论(0)