对大数据的认识(1).pdf

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
对于大数据的认识和理解 这学期选修了网络工程这门课程,当时是抱着扫盲的态度选的这门课程,给 自己定的目标不高,只需要对一些基础的概念和网络结构有些认识就可以,以免 以后在人前谈论的时候不至于成为 IT 文盲,被一些专业性的技术人员所吓倒。 事实证明,态度决定一切,由于自己刚开始设定的目标就比较低,所以注定能够 上升到的水平也就不高。 经过这几周的学习,对计算机网络的基础知识和大致结构有了一个粗浅的认 识。由于学生本身这方面的基础不扎实,知识结构在这方面比较薄弱,所以不能 在技术方面进行深入的研究,只能对一些理论性的知识做一些了解和认识,建立 起大概的知识框架。在学习过程中,魏忠老师所提及的知识中有一点印象最为深 刻,关于大数据Big Data 方面的提及引起了我很大的兴趣,越是自己私下里做了 一些阅读和查询(主要是维克托·迈尔-舍恩伯格的 《大数据时代》和网络上查看 的一些资料)。最后提交的这篇课程总结就着重报告一下自己在阅读了他人关于 大数据的一些理论后自身的认识。 在这之前,我发现身边很多人都提起过大数据,其中包括老师和同学。可是 对于这些热门的新技术、新趋势人们往往趋之若鹜却又很难说的透彻,如果你问 他大数据和你有什么关系?估计很少同学能说出一二三来。究其原因,一是因为 大家对新技术有着相同的原始渴求,至少知其然在聊天时不会显得很“无知” ,因 为现在人们普遍都有以一种信息焦虑感,别人知道的东西我不知道,就会感到焦 虑,无论这些信息对你有没有用;二是在工作和生活环境中真正能参与实践大数 据的案例实在太少了,所以大家没有必要花时间去知其所以然。当然我也一样, 虽然我希望能有些不一样,但是自己实在欠缺 IT 这方面的知识,所以也只能查 阅一些资料,翻阅了最新的专业书籍,在自己局限的认识下把这些些零散的资料 碎片或不同理解论述综合起来做一个类似于文献综述的报告,其实我很真诚的希 望进入事物探寻本质。下面就从理论、技术、实践这三个层面写一下大数据的认 识 大数据的一些相关理论: 最早提出大数据时代到来的是麦肯锡:“数据,已经渗透到当今每一个行业 和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示 着新一波生产率增长和消费者盈余浪潮的到来。” 业界(IBM 最早定义)将大数据的特征归纳为 4 个“V” (量Volume ,多样 Variety ,价值Value ,速Velocity ),或者说特点有四个层面:第一,数据体量巨 大。大数据的起始计量单位至少是 P (1000 个T )、E (100 万个T )或Z (10 亿 个 T );第二,数据类型繁多。比如,网络日志、视频、图片、地理位置信息等 等。第三,价值密度低,商业价值高。第四,处理速度快。最后这一点也是和传 统的数据挖掘技术有着本质的不同。 很早就流传着一句话:三分技术,七分数据,得数据者得天下。先不论这句 话是谁说得,但是这句话的正确性已经不用去论证了。维克托·迈尔-舍恩伯格在 《大数据时代》一书中举了很多例证,都是为了说明一个道理:在大数据时代已 经到来的时候要用大数据思维去发掘大数据的潜在价值。书中,作者提及最多的 1 是 Google 如何利用人们的搜索记录挖掘数据二次利用价值,比如预测某地流感 爆发的趋势;Amazon 如何利用用户的购买和浏览历史数据进行有针对性的书籍 购买推荐,以此有效提升销售量;Fare cast 如何利用过去十年所有的航线机票价 格打折数据,来预测用户购买机票的时机是否合适。这里维克托·迈尔-舍恩伯格 所认为的大数据思维是:1 需要全部数据样本而不是抽样;2 关注效率而不是精 确度;3 关注相关性而不是因果关系。 大数据是什么?投资者眼里是金光闪闪的两个字:资产。比如,Facebook 上市时,评估机构评定的有效资产中大部分都是其社交网站上的数据。如果把大 数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能 力” ,通过“加工”实现数据的“增值” 。 大数据的一些相关技术: 1)云技术: 大数据常和云计算联系到一起,因为实时的大型数据集分析需要分布式处理 框架来向数十、数百或甚至数万的电脑分配工作。可以说,云计算充当了工业革 命时期的发动机的角色,而大数据则

文档评论(0)

tiger01 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档