- 1、本文档共80页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据科学入门–让数据思维成为生活的一部分
數據科學入門 –
讓數據思維成為生活的一部分
丘祐瑋 – David Chiu
EMAIL: david@
網站:
電話: +886929094381
關於我
• 大數軟體有限公司創辦人
• 前趨勢科技工程師
•
• 大數學堂
/
• 粉絲頁
/largitdata
• R for Data Science Cookbook
/big-data-and-business-
intelligence/r-data-science-cookbook
• Machine Learning With R Cookbook
/big-data-and-business-
intelligence/machine-learning-r-cookbook
Machine Learning With R Cookbook (机器学习
与R语言实战) R for Data Science Cookbook
Author: Yu-Wei (David) Chiu
什麼是數據科學?
數據 科學
哪家公司沒有數據 ?
哪家公司不科學了?
EDUCATION FINANCE AGRICULTURE
+ TECH
如何快速整合分析不同的資料源
如何快速整
合分析不同
的資料源?
加一點數學統計 加一點工程 產生數據科學
只有工程統計還不夠
數據科學
數據科學能力
• 統計 (Statistic)
單變量分析、多變量分析、變異數分析
• 資料處理 (Data Munging)
抓取資料、清理資料、轉換資料
• 資料視覺化(Data Visualization)
圖表 、商業智慧系統
軟體工程師 資料庫管理員 統計學家 商業分析師
學習統計並瞭解 如何處理 要知道如何處理
數據科學能力 了解演算法並知道
如何詮釋結果 非結構化資料 巨量資料問題 在不同資料量下該
使用何種工具
解構! 探討數據科學流程
使用數據擬定策略
數據科學步驟
資料視覺化
資料分析
資料儲存
資料清理
資料蒐集
資料蒐集
結構化資料
• 每筆資料都有固定的欄位、固定的格式,方便程式進行後續取用與分析
• 例如:資料庫
半結構化資料
• 資料介於結構化資料與非結構化資料之間
• 資料具有欄位,也可以依據欄位來進行查找,使用方便,但每筆資料的欄位
可能不一致
• 例如:XML, JSON
非結構化資料
• 沒有固定
文档评论(0)