- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据技术在电商行业应用
大数据技术在电商行业应用
摘 要 随着互联网和计算机技术的迅速发展,我们生活中的许多行为和言语都会以数据的形式被存储,而这些数据的背后则蕴含着巨大的价值。大数据时代的到来,使社会各行各业都发生了很大的变化。我国电子商务行业发展迅速,如何牢牢抓住“大数据”这一机会,是摆在众多电子商务企业面前的挑战。本文主要通过分析大数据在电商行业中的应用实例,反映出大数据对电商行业的发展影响以及对社会发展的推动作用。
【关键词】大数据 电子商务 京东
1 电商行业的发展过程
电子商务行业在我国没有很长的发展历史,因为互联网在我国也是近些年才迅速发展的。电子商务在发展初期,仅仅是做到将线下的交易过程转移到线上,人们虽然能够通过互联网进行购物等行为,但是没有体验到线上交易的便捷性和优越性。所以电子商务行业一开始发展迟缓。
随着计算机技术和网络技术的进步,用户可以通过电脑或者手机方便的进行线上交易。这个阶段,电子商务行业遇到了另一个问题,那就是订单量过多,物流速度无法适配,导致物品要过一段时间才能够到达目的地。这令用户和商家都非常苦恼。
大数据时代到来后,电商行业遇到了转机,通过大数据技术,可以为用户推送用户感兴趣的商品以及距离用户更近的商品,这样既提高了用户使用的舒适度,也尽可能的减少了在运送过程中消耗的时间。
2 大数据及大数据技术简介
2.1 大数据简介
大数据是目前非常火热的一个词汇,本文将大数据定义为产生于信息爆炸的时代背景下,数量庞大,种类丰富的数据的集合,并且该数据集合蕴含着很大的开发和使用价值。大数据具有“4V”特征,分别是Volume(数据量庞大),Variety(数据类型多元化),Velocity(数据产生速度快)以及Value(数据价值高)。同时具备这4个特征,则可以称之为大数据。
大数据的计量单位已经不是GB能够满足的了,要用TB甚至PB或更大。并且在未来的几年内,还会有几十ZB的数据源源不断地产生。这体现了大数据数据量的庞大。
大数据的数据类型非常丰富,包括大量结构化以及非结构化数据,比如音频,图片以及视频等等,还包括传感器的数据,互联网搜索的数据等。所以大数据不仅仅是数据量大,并且数据类型也很繁多。
如果没有快速处理数据的能力,仅仅拥有庞大的数据是远远不够的。通过云计算的存储和计算,大量的数据可以被较快的处理,这样可以使大数据被较快地使用。
在海量的数据中,蕴藏着无限的价值,许多行业和企业已经嗅到了其中的价值,本文介绍的就是电商行业是如何利用大数据进行变革和发展的。
2.2 大数据技术简介
大数据的总量每两年就会翻一倍,呈现出爆炸式的增长趋势。如果只存储大数据,而不处理和分析大数据,那么大数据是没有价值的,所以大数据的出现促进了大数据技术的发展。本文对大数据技术的定义如下:大数据技术是能够在海量的各类数据中,有效地进行筛选并且快速找到具有利用价值的数据的技术。
大数据技术中,使用较广泛的是Hadoop技术。Hadoop可以简单的理解为是HDFS(Hadoop Distributed File System)和MapReduce技术的集合。
HDFS是一种分布式文件系统,与普通文件系统有所差??。每个磁盘上有一个默认的数据块的大小,一般为512字节,是磁盘对数据进行读写时要求的最小单位。文件系统也有块的概念,大小一般是磁盘块大小的整数倍。HDFS块的大小一般默认为64MB,要比普通文件系统的块大很多(普通文件系统块大小一般为几千个字节)。这样使得HDFS减小了很多磁盘寻址的开销,提高了读写速度。HDFS最大的优势是可以存储超大文件。原理是HDFS不是将所有文件的块存储在一个磁盘上,它可以利用磁盘系统上的任意一个磁盘进行数据的存储。因此HDFS通常可以存储TB级别,PB级别甚至更大级别的数据。
HDFS读写原理:
在了解HDFS读写原理之前必须要了解两个分布式节点概念,一个是NameNode,另一个是DataNode。NameNode在HDFS中扮演者“调度员”的角色,其中存储了HDFS的元数据,比如集群中的节点信息,每个数据有几分副本数据等。DataNode就是集群中数据的存储节点。每个文件会有多个副本存储在不同的DataNode中以保证数据不会丢失。
HDFS写原理:
(1)客户端将消息发送至NameNode,如图1①。
(2)NameNode给客户端发送消息,指引客户端将文件写入Data A,B,D中。并且先向B节点发送请求,如图1②。
(3)客户端给B节点发送消息,希望它保存一份副本,并且希望B向A,D发送消息,让A,D都保存一份副本,如图1③。
(4)B节点发送消息给A节点
您可能关注的文档
最近下载
- 2024版酒店operaPMS系统中培训教程 .pdf VIP
- (2025)西宁市入团考试精选题库(含答案).docx VIP
- 提高椎管内分娩镇痛率PDCA精品课件.pptx VIP
- 2020运动训练人才培养方案(中职).pdf VIP
- 沥青路面铺筑施工技术交底 .pdf VIP
- 2025新疆喀什地区“才聚喀什智惠丝路”秋季招才引智707人笔试备考试题及答案解析.docx VIP
- 电力公司电力设施保护与抢修手册.doc VIP
- DL_5070-2012-T_水轮机金属蜗壳现场制造安装及焊接工艺导则.pdf VIP
- 半导体材料(大学课件)张源涛ppt全套教学课件.pptx
- 卫生监督手段与程序小测试卷含答案.docx
原创力文档


文档评论(0)