涂子沛大数据时代中国挑战.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
涂子沛大数据时代中国挑战

涂子沛大数据时代中国挑战   2013年,“大数据”这一概念以夺目之势走进了我们的视野,学者在介绍,政府官员在谈论,世界互联网企业则纷纷启动“大数据”竞争,有媒体将其称为“大数据元年”。时至2014年,大数据正由技术热词变成一股社会浪潮乃至国家战略。   今年2月,畅销书《大数据:正在到来的数据革命》的作者――旅美华人学者涂子沛,做客凤凰视频世纪大讲堂栏目,并预测未来5年内,大数据会在中国遍地开花。   一个真正的信息社会。首先是一个公民社会   头一回在美国上统计课,在国内政府部门做过近10年数据统计工作的涂子沛觉得“眼前一亮”。   这一讲的内容是统计学的意义。大胡子的印度裔教授一本正经地对学生们说:“我们信靠上帝。除了上帝,任何人都必须用数据来说话。”   教授大胆的观点一下子震撼了中国学生涂子沛。在他的印象中,数据往往被当成论证工具,更像是一种“证明领导意图的手段”。   但在这里,“数据”二字似乎有另一重含义。   2007年底,奥巴马访问了谷歌公司的总部。作为他的支持者,涂子沛在视频网站上观看了这次演讲。   “人民知道得越多,政府官员才可能更加负责任。”当时这位总统候选人一上来就表达了建设开放政府的决心。   面对谷歌公司的员工,奥巴马继而雄心勃勃地说:“我将把联邦政府的数据用通用的格式推上互联网。我要让公民可以跟踪、查询政府的资金、合同、专门款项和游说人员的信息。”   涂子沛记得,演讲在此时被热烈的掌声所打断。   这是涂子沛第一次将“公民权利”这样的大词与“数据”联系起来。也正是从那时起,这个从卡内基?梅隆大学毕业、并已经在一家美国公司就职的数据库程序员萌生了一个系统的写作计划。   2011年12月,涂子沛将21万字的书稿寄给国内几家出版社。   一家出版社的编辑对他说:“不管别人开出什么样的条件,我们都要。”而另一家出版社的主编则给涂子沛回复了一封邮件,写道:“这是一本中国社会需要的书。”   2012年7月,《大数据》一书出版。翻开这本以0和1的二进制代码图案为封面的新书,扉页上的题记别具一格:“一个真正的信息社会,首先是一个公民社会。”   “大数据”这一概念便迅速以夺目之势走进了我们的视野。   “什么是大数据?”初次接触大数据的人们最好奇的就是这个问题。   涂子沛解释,这首先是对信息爆炸时代的崭新描述。“如果把2013年全世界预计将存储的数据总量全部记在书里,那么这些书可以覆盖整个美国52次。如果将这些数据存储在只读光盘上,这些光盘可以堆成五堆,每一堆都可以伸到月球。”   不过在涂子沛看来,仅仅用数量之大解读大数据不够完整,能量之大才是大数据这枚硬币的另一面。一个经典的案例是,在甲型HINI流感爆发前几周,谷歌公司通过观察5000万条美国人最频繁检索的词条数据,发现“哪些是治疗咳嗽和发热的药物”这一主题的检索频率大增,进而准确预测了流感的发生及传播范围。   “面对海量数据,谁能更好地处理、分析数据,谁就能真正抢得大数据时代的先机。”这是涂子沛对大数据威力的评价。   美国是怎样做的   涂子沛在美国匹兹堡市一家联邦政府的合同商公司做程序员,每天面对的东西都是数据、代码或大大小小的表格。   但无论从哪个角度观察,他都不是一个单纯的IT行业的从业者。涂子沛爱读刘瑜和陈丹青的书,和匹兹堡大学著名史学教授许倬云是好朋友,还会在一个人开车的时候听几段古典诗词的朗诵。他的房间里,大部头的编程书籍和不少从国内带来的人文类图书整齐码放在书架上。书房的窗外,大树的树叶伸手可及,他喜欢对着一片新绿写作。   上世纪70年代初,涂子沛出生在一个法官家庭。因为从小看父亲断案,他很早就开始思考什么是“正义”这样的大问题。90年代中期,他进入当时的华中理工大学读书。学校里有人文讲堂的讲座活动,这个计算机专业的学生是最忠实的拥趸之一。讲座结束后,他常会在昏暗的路灯下追着讲师们请教问题,直到老师的家门口。   时任中国人民大学副校长的谢韬也来过人文讲堂。当时他给涂子沛签名并留下这样一句赠语:“要做新世纪国家的建设者。”   年已不惑的涂子沛至今仍然保留着这份情怀。他在博客上记录匹兹堡市的学生们如何因为征税问题质询市长,也写下这里的市民对阻止他们游行的匹兹堡警方怎样提起集体诉讼。   随后,看到奥巴马2007年在谷歌公司的演讲开始,涂子沛才意识到,原来自己一直关心的“公平正义”,竟然与每天朝夕相处的数据有着如此紧密的联系。   在此以前,和大部分人一样,涂子沛更愿意从技术层面去关注什么才是“大数据”――这是对信息爆炸时代的崭新描述。它的基本单位是“太”(TB),而1000个太则等于一“拍”(PB)。打个直观的比方,美国国会图书馆是世界上最大的图书馆之一,它所有印刷品的信息量加起来只有15太。而全美国仅在2010年一年的

文档评论(0)

3471161553 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档