- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
(完整word版)大数据技术在电子商务中的研究
大数据技术在电子商务中的研究
随着云计算、物联网、社交网络、移动互联网等新兴技术的层出不穷和持续发展,
人类全面进入了大数据时代。各种数据正在迅速膨胀、变大,逐步表现出爆炸性
增长的趋势,数据的影响已经渗入到了产业、科研、教育、家庭和社会的各个层
面。随着时间的推移,人们将越来越多的意识到对数据的需求和掌握已不再局限
于以往的数据挖掘和数据分析,而是为人们获得更为深刻、全面的洞察水平提供
前所未有的支持。《纽约时报》2012年2月的一篇专栏中称,“大数据”时代已
经降临,在商业、经济及其他领域中,决策将日益基于数据和分析而做出,而并
非基于经验和直觉1。2012年3月,美国总统奥巴马公布了美国《大数据研究和
发展计划》,标志着大数据已经成为美国的国家战略,上升为国家意志。那么什么
是大数据呢?大数据指的是在“多样的或者大量的数据中快速获取信息的水平”。
IT业界通常将大数据的特征概括为四个“V”:数据量(volume)巨大,数据类型
(variety)多,数据价值(Value)大,发掘出价值的速度(Velocity)快2。大
数据和传统所说的数据库有所不同。诞生在二十世纪七十年代的传统数据库是小
型的、单一的、孤立的,基于小范围的抽样样本统计。而大数据则要求穷尽一切相
关样本,搜集尽可能全面的数据,大数据的数据集拥有的不是支离破碎的割裂数
据,不是数据片段,而是完整的数据。数据的海量与数据的完整性使大数据有着传
统的数据库无法比拟的信息优势。
1大数据的重要性
信息科技经过多年的发展,数据已经渗透到国家治理、国民经济、企业发展的方
方面面.这些数据中隐藏着有价值的模式和信息,需要相当的时间和成本才能提取
这些信息。一些新兴的互联网公司,利用新技术大规模地收集数据,分析和预判客
户行为,然后在不同的行业纵横捭阖。而缺少数据资产、缺少强大数据分析水平的
公司,则无疑将处于被颠覆的边缘。所以大数据技术虽然发源于信息科技,但其
影响力已经远远超出信息行业,正在“吞噬”和重构很多传统行业,广泛使用数据
分析手段管理和优化运营的公司其实质都是一个数据公司.能够毫无疑问地说,大
数据事关国计民生、产业兴衰、公司存亡。麦当劳、肯德基以及苹果公司等旗舰
专卖店的位置都是建立在数据分析基础之上的精准选址。而在零售业中,数据分
析的技术与手段更是得到广泛的应用,传统企业如沃尔玛通过数据挖掘重塑并优
化供应链,新崛起的电商如卓越亚马逊、淘宝等则通过对海量数据的掌握和分
析,为用户提供更加专业化和个性化的服务。著名的信用卡国际组织万事达通过
(完整word版)大数据技术在电子商务中的研究
度析来自210个国家的15亿信用卡用户的650亿条交易记录,分析得出商业发展
和客户消费趋势,取得了极大的营销价值3。
2大数据技术介绍
2.1Hadoop简介虽然数据量巨大是大数据时代的特点,但这并不意味着数据的含金
量高和对数据的理解要求低。事实上,庞大的数据中往往掺杂着太多的无效数
据,简单粗放式的数据统计和分析往往不能得到真正有价值的内容,所以对大数据
技术提出了更高层次的挑战,使用传统的数据工具是远远无法满足大数据需要
的,由此产生了大数据技术.Hadoop是当前最为流行的大数据技术,从诞生之日
起,Hadoop便与大数据有着千丝万缕的联系。Hadoop是一个用java语言实现的
软件框架,在由大量计算机组成的集群中运行海量数据的分布式计算,它能够让
应用程序支持上千个节点和PB级别的数据.Hadoop是项目的总称,主要是由分布
式存储(HDFS)、分布式计算(MapReduce)等组成。Hadoop的设计原理来自于谷
歌的GFS和MapReduce模型,能够看作是后者的开源实现.因为其能够运行在对硬
件配置要求低、扩展性好、容错水平强及具有强大的并行处理水平等特点的设备
上,在多个行业得到广泛的应用,成为当下大数据领域的热门技术。谷歌、雅虎、
亚马逊和Facebook都开发了以Hadoop为基础的大数据应用程序。Hadoop是由多
个技术模块组成的,其体系架构如图1所示.各模块的主要功能如下.⑴Pig是一个
基于Hadoop的大规模数据分析平台,Pig为复杂的海量数据并行计算
您可能关注的文档
- 0.03是多少百分比 .pdf
- 2020广东省广州市中考数学试卷 .pdf
- 2019版必修中外历史纲要上册第25课人民解放战争导学案(无答案.pdf
- 2019版七年级数学下册第五章生活中的轴对称5.4利用轴对称进行设计教案新 .pdf
- (2023)超薄柔性玻璃(UTG)项目可行性研究报告写作模板-立项审批(一).pdf
- 2019年中级统计师考试基础知识仿真习题及答案十二含答案 .pdf
- 2019年办公室秘书工作计划4篇 .pdf
- 2011届高三政治一轮复习哲学学案第五课把握思维的奥妙 .pdf
- 2022--2023学年华东师大版七年级数学上册期末复习试卷(含答案).pdf
- 2020年春上海科技版物理八年级下册第八章第3节教案设计 .pdf
文档评论(0)