- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
I如何把“数据”转化成可以行动的“信息”
栏目:一个推荐
期目:2014年2月
如何把“数据”转化成可以行动的“信息”
作者:Mike Rozlog“Turning Data into Actionable Information Reliably”
编译:王玉荣
题目中的这个问题,我理解是个本质。在数据时代,数据不管从哪里获取、用什么工具获取,也不管数据规模是否够得上是“大数据”,也不管你用来分析和利用这些数据的是BI软件(商业智能软件)还是数字化营销软件如AOS系统(注:美国安客诚公司推出的“受众运营系统”),你总得回答一个关键问题:面对一堆数据,你能去做什么,而且这个“做什么”是能有效变成真金白银的收益的。
所以,当我看到Mike Rozlog最新于2014/2/3发布的一篇文章中用到这个标题时,引起了我的兴趣。把文中一些主要观点编译概述如下,供朋友们参考,其中也穿插了我的一些理解、注解、举例。
作者首先指出:“数据”在空前增长,人们在提供着信息,情愿地或无心地,通过社交媒体或者其他终端。作者描述了自己在FACEBOOK的情况,他居然不知不觉地、日积月累地在FACEBOOK那里列举出了他自己喜欢的160张音乐专辑,这就是“无心”中在提供数据,不想不知道,一想自己也吓一跳。
其实中国国内的朋友应该也有这个体会,当你在淘宝天猫购物时,有没有注意到在购物车结算价格时,有一个“是否匿名购买”的选项,很多人没有费力去勾选一下,那么也就是愿意实名购买了,那么你便“无心”也是“情愿”地提供了一条关于“何时、您、多少价格、网购了什么物品、怎么支付的、选择的哪种物流方式、联系电话和物流地址”的非常详细的信息。淘宝和天猫这个小细节在于把什么作为“缺省项”,如果把“是否实名购买”作为一个勾选项,把“匿名购买”作为缺省选择,估计也是大多数人“不作为”、不会去勾选,而这种“匿名购买”对淘宝的大数据战略无益,因此,对“是否匿名购买”的勾选项的“不作为”,就日积月累地“作为”了很多事情了。
但这只是日益增长的“数据”。作者认为,“数据”和“信息”是不同的,不同的关键在于“数据之间的连接(links)”。(注:我们这里不翻译为“链接”,以避免读者一下子就想到是网络阅读时去点一下链接的那个“超文本链接”)。这个“连接”强调的是数据之间的“关系”。数据本身是一堆原材料,类似数字、单词、计数、字串、图片、视频、音乐,哪怕他们被存储在“关系数据库”中,他们也天然地彼此之间没有关系,除非人去赋予他们关系。
而这种人为去赋予数据之间的“关系”,就是在建立数据之间的“连接”。如果一组或一连串的“连接”是正确的,那么数据就生成了“信息”,那么就可以基于“信息”做出一些假设/判断,从而去开展行动。如果“连接”错了呢,那么就可能相应地引发错误的行动。
比如下面这个例子,关于美国上个世纪40年代早期对脊髓灰质炎(我们俗称的“小儿麻痹症”)的病因的研究。“原始数据”显示是入夏日天气渐暖时,病例增加。戏谑的是,“原始数据”还显示,当脊髓灰质炎的病例增加时,冰激凌销量也以同比例在增长。1952年美国有将近58000人(很多是孩子)被诊断得上了脊髓灰质炎,一场全国性的大流行病。公共卫生部门的专家于是建议要避免食用冰激凌、糖水和其他高塘食物。今天回头看历史,认为冰激凌是病因的想法当然很可笑,但那时候的确是“病急乱投医”了。
结合我们今天的情况来看,我们怎么把海量的信息转变成能带来行动的有用的信息、做出更好的决策而不是上例呢?我们已经有了一些数据采集的技术,也有了指数级增长的比以前多得多的数据,但我们还是没有生成好信息的那个神秘酱料。例如,当你看到以下常见的两列数据,见图1:
销售数据 商品编号 数量 成本 售价 日期 开票
客户数据 姓名 街道 城市 省份 邮编 年龄 数据来源 图1 常见数据列
读到本文的朋友对上面的数据列都是非常熟悉的,也许还有更多列更丰富的信息。而关键的问题是,你面对这些数据列,你能问出什么问题呢?肯定读者们能列举出一串经典的问题,但很有可能,漏掉了问那个有关键意义的一个问题。
Mike Rozlog指出说,实际上,应该再问一个“目前的数据尚不能支持的问题”,即“为了回答我真正关心的问题,我还缺哪些数据呢”?这就是“数据增补”的概念(Data Augmentation)。想一想,你可能关心的问题是“什么样的人是我生意的典型客户?”“我的下一个店铺应该选址在哪里?”“应该增加一种新产品系列的销售吗?”我们发现,目前的“客户数据”和“销售数据”无法回答这些,只有当增补了“MAP GIS”(地图地理信息系统)和“Census Data”(人口统计数据)”之后,才能做的更好,见图2。前者包括位置地点、路线、实际位移折线图等,或者包括邮编、平均收入、孩子的个
您可能关注的文档
- [AndroidNDK环境搭建及遇到的问题详解.docx
- l海陵岛保利银滩项目简介1742326667.ppt
- I利率平价理论InterestRateParity介绍认为两个国家利率的差额相等于远期兑换率及现货兑换率之间的差额.doc
- l消费函数.ppt
- l消费信用的利与弊.ppt
- I利率政策对经济发展的作用.doc
- l消费心理学-第一章导读.ppt
- [AndroidSDK测试环境安装.docx
- l海员及海员学习、生活及航海学院如何培养海员的.ppt
- [Android测试工具TheadingTest测试CSDN开源版手机游戏.docx
- 2024年头灯资金筹措计划书代可行性研究报告.docx
- 2024年澳代巴豆酸乙酯资金需求报告代可行性研究报告.docx
- 2024年水污染防治设备资金筹措计划书代可行性研究报告.docx
- 2024年纸卷包装输送系统资金申请报告代可行性研究报告.docx
- 2024年湿疹药物资金申请报告代可行性研究报告.docx
- 2024年家用通风电器具资金筹措计划书代可行性研究报告.docx
- 2024年数字模拟混合输出仪表通讯模板资金申请报告代可行性研究报告.docx
- 2024年计算器及货币专用设备资金需求报告代可行性研究报告.docx
- 2024年手工制纸及纸板项目投资申请报告代可行性研究报告.docx
- 2024年抗生素类药物资金筹措计划书代可行性研究报告.docx
文档评论(0)