- 2
- 0
- 约3.9千字
- 约 7页
- 2019-06-07 发布于北京
- 举报
做好数据科学,离不开这7步
如何做好数据科学呢?
微软高级数据科学家 Brandon Rohrer 概括了做数据科学的七大步骤,手把手教你做数据科学。
1. 获取更多的数据
数据科学的原材料是数字和名称的集合,测量、价格、日期、时间、产品、标题、行动等,数据科学无所不包。你也可以使用图像、文字、音频、视频等复杂数据,只要你能将它们简化为数字和名称。
获取数据的机制可能非常复杂,事实上,数据工程师就像忍者一样。不过,本篇文章将主要聚焦于数据科学。
2. 问一个尖锐的问题
数据科学是通过数字和名称组成的数据集合来回答问题的过程。你问的问题越精确,越容易找到令你满意的答案。在选择问题的时候,想象你的面前是一个可以用数字或字段来告诉你宇宙中一切奥秘的圣人,他的回答总是模糊不清、令人困惑,而你希望问一个精准而无懈可击的问题,让他忍不住告诉你问题的答案。
模糊的问题如我的数据能告诉我什么?、我应该做什么?我怎样提高利润?会带来无用的回答,而清晰的问题如第三季度我能在蒙特利尔卖出多少产品?、我车队中的哪一辆车会先坏?会带来清晰的答案。
在有了问题后,要看你的数据是否能够回答这些问题。如果你的问题是我的股票下周的价格是多少?,那就要确保你的数据中有股票的历史价格;如果你的问题是 88型航空发动机能够工作多少小时?,那就要确保你有多台
原创力文档

文档评论(0)