- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[身边的大数据
躲不开的大数据
提起大数据,很多人都有一个误解,过去我们认为,随着人类信息记录技术和传输技术的发达,以及成本越来越低,我们的数据记录就从一些小数据慢慢变成一个巨大的数据包,大数据是这样吗?错!大数据的本质不在于它的大,而在于它的全!我们是通过多维的、多角度的记录一个世界,或者一个人的真相和行为轨迹,我们来判断它原本的本来面目。
很多人一提大数据,就把它当做一个高大上的事物来对待,其实所谓的大数据,更多的是一种理念,今天,我就将我对大数据的理解和大家做一个分享。(1’02”)
【Part?1】
大数据有一个关键词,叫做“交叉复现”,或者叫做“交叉复用”。什么意思呢?我举一个例子。
在时装界有个大品牌叫Prada,它在纽约的旗舰店最近几年就搞了一个小改革,每一件衣服上都有一个芯片,当这件衣服被拿到试衣室的时候,试衣室有一个记录仪,就记录一次,说明这件衣服进过试衣室,但这件衣服是不是被买了,这个探测器不管。过去的所谓的商业数据就是进、销、存,我进货多少、销出去多少、库存有多少,它只记录这些信息,这叫大数据吗?这不叫大数据,因为它虽然数据量非常大,但是它记录的是一个单维信息,可是当Prada做了这个小实验,虽然只记录一个并不太大的一个数据规模,但是由于它角度变了,于是大数据的规模就突然一下出来了,大家想啊,原来Prada只能知道我哪件衣服好销,但是有一类衣服是这样的,大家一看很喜欢,摘下来到试衣间试,试完了之后,因为某种缺陷,大家把它撂下了,没买,所以当这两个数据,就是柜台边的销售数据和试衣间里面的试衣数据,两个一碰,Prada就能找出一些衣服的地款型,它们很好看,第一感觉很好,但是卖不掉,一定是因为有什么缺陷,把这个缺陷改进完了,等于Prada就马上多了几款热销的品种,所以在商业上,这样多维的交叉复现就这样用起来了。(2‘07”)
再比如说,互联网金融,虽然现在学术界对其争论非常多,但它一定是一种先进的方式,因为它正在用大数据的方法,一点一点地去逼近在传统社会中要用极高的成本去解决的一个问题,就是信用差别。传统的银行要决定给一个贷款客户办理贷款业务,这得下多少功夫啊!这得老师傅带一个团队,做各种各样的调查,最后发现信用不错,我们放心把钱借给你。可是在互联网时代,所有的信用判别,要用大数据的方法,它的成本会低到不像话,比如一家互联网金融公司,他做P2P的贷款,你要找这家公司贷款,它只要你填一个简单的表格就行了:姓名、住址、电话号码、你的单位、你的工资卡的卡号,就是证明有人正常给你发工资,你有基本的信用记录,就行了!你申请贷款几万、几十万,就这么给你了!那你说这不是不负责任嘛?对,在传统社会看来,这就叫不负责任,但在大数据时代来看,未必如此。他可以通过多个信息、通过交叉复现得知你很多东西,比如说你的住址,这是不是一个好的小区,你住不住得起好房子?那你说我填一个假地址行不行?不行的!大数据交叉验证,它可以到你微博上看呀,看你微博在哪儿发,因为发微博,最多的可能性一个是家、一个是单位,你如果有单位,因为你有工资卡,对不对?那另外一个点,发微博最多应该就是你家,那你常住的地址和你填的这个地址是不是吻合,这就是交叉去验证。然后再比如说,它能够知道你每个月交的电费,它就知道你家里的电器的使用量,这基本上也可以衡量出一个人的生活水平和收入水平。再比如说,它知道你的电话号码,那你电话费交的情况是怎么样呢?你买这个电话是分期付款还是一把付掉的呢?你用的电话是一种什么类型的电话呢?等等。所有这些信息通过交叉验证,就又能呈现出来。甚至在洛杉矶,有一家专门就做给那种叫高风险贷款,就是你没啥信用记录,或者信用记录不好的人,我给你放贷款,这家公司就用了很多大数据的手段,它甚至细到什么程度,比如说你在银行,你总要填自己姓名吧,它就看你怎么填,它不会告诉你的。你如果全是小写,这是一种很不规范的填法,说明你这个人有点粗枝大叶;如果你全是大写,说明你这个人有点狂妄自大。那最标准的填法是什么?首字母大写,后面小写。就说明你这个人很精细,那很精细的人通常来说,你的信用度要好那么一点点,那它就把这一点点记入对你信用的判别的整体的数据库,人家监控的就这么细!洛杉矶这家公司试验下来,它的坏账率比同样做这一行,但是没有用大数据的整个坏账率要低60%!这是我用最简单的方法给大家讲大数据起作用的原理。(4’21”)
【Part?2】
那有些人又说了,这和我有什么关系呢?我不排斥别人用大数据,但我自己用不上大数据,碰到大数据我躲着行不行?实话告诉你,还真不行,因为在座的每一个人,都是大数据的提供者。比如说你用的是智能手机,你新装软件的时候,它会有一条提示的:这个软件会调用你的通话记录、短信、WIFI、LBS、你的地址……所有这些东西要调用,可不可以?可以你就装,不可以你别装!人家软件公司
文档评论(0)