必修1 数据与计算第五章 “网络购物平台客户行为数据分析和可视化表达”可视化报告.docxVIP

必修1 数据与计算第五章 “网络购物平台客户行为数据分析和可视化表达”可视化报告.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

网络购物平台客户行为数据分析报告

一、引言

随着移动互联网和物联网的飞速发展,人类社会产生的数据以惊人的速度增长。海量的数据几乎包含一切形式的结构化、半结构化以及非结构化的数据,如网络日志、音频、视频、图片、地理位置信息等。如何高效地对这些数据进行采集、存储、处理,并从中发掘到有价值的信息,是大数据分析处理需要解决的问题。

二、分析目的

网络购物中,消费者购物行为的任何一个细节都被服务器记录着。通过大数据分析,商家可以了解消费者的偏好甚至预测其购买行为,如下图所示。大数据分析使得商家可以追踪用户的行为并确定最有效的方式以提升用户对购物平台的忠诚度,根据用户的个性化需求提供相应的产品或服务以获得更大的市场占有率。

认识大数据及其特征,认识大数据对人们日常生活的影响,了解数据采

集、分析和可视化表达的基本方法;学会选用恰当的软件工具或平台处理数据,完成分析报告;理解对数据进行保护的意义。

三、分析内容与步骤

1.分析内容

(1)网购行为数据采集。

(2)网购行为数据分析。

(3)网购行为数据可视化表达。

2.分析步骤

(1)确定数据来源。

(2)确定数据分析方法。

(3)用恰当工具可视化表达数据。

四、分析工具和方法

利用思维导图工具和“头脑风暴”的方法组建团队、明确任务;采用python工具和可视化分析工具,实施探究。

五、分析过程

1.确定数据来源

我们所分析的网购数据,必须来源于某一个网购网站。为了方便学习,我们利用虚拟机文件,搭建了一个“网络商城”。我们利用Python工具中的爬虫模块,对数据抓取和分析。

抓取数据的程序如下所示:

(1)抓取页面设置。

(2)抓取商品标题。

(3)抓取商品价格。

(4)爬取商品订单量。

(5)抓取出售商品的店铺名称。

2.确定数据分析方法

数据分析一般包括特征探索、关联分析、聚类与分类、建立模型和模型评价等。

(1)大数据特征探索的主要任务是对数据进行预处理,发现和处理缺失值、异常数据,绘制直方图,观察分析数据的分布特征,求最大值、最小值、极差等描述性统计量。

(2)关联分析就是分析并发现存在于大量数据之间的关联性或相关性,从而描述一个事物中某些属性同时出现的规律和模式

(3)聚类分析是一种探索性的分析,在分类的过程中,人们不必事先给出一个分类的标准,聚类分析能够从样本数据出发,自动进行分类。

(4)数据分类是大数据分析处理中最基本的方法。数据分类通常的做法是,基于样本数据先训练构建分类函数或者分类模型(也称为分类器),该分类器具有将待分类数据项映射到某一特点类别的功能。

3.用恰当工具可视化表达数据

大数据可视化可以让人们快速抓住要点信息,让关键的数据点从人们的眼睛快速通往心灵深处。从常用和实用的维度,大数据可视化的呈现类型主要分为探索和解释两种不同的类型。探索类型可以帮助人们发现数据背后的价值,而解释类型则把数据简单明了地解释给人们。按照处理数据类型的不同,可视化呈现的主要方式如下表所示。

六、分析结果

1.大数据是人们提取信息、做出决策的重要依据,是推动信息社会发展的重要资源

大数据的产生是与人类日益普及的网络行为所伴生的:物联网、云计算、移动互联网、车联网、手机、电脑以及遍布地球各个角落的各种各样的传感器,无一不是数据的来源或是承载的方式。互联网生成的数据量,不仅远超此前一切人类所生成的数据量的总和,而且在以大爆发性的速度不断增长。

大数据成为人们提取信息、做出决策的重要依据,是推动信息社会发展的重要资源。

2.大数据采集的工具和方法是大数据采集的关键

大数据的来源广泛(主要是互联网和物联网)、类型丰富、规模巨大。采集大数据首先要明确大数据应用项目的需求,围绕选定的项目主题,制订大数据采集的需求清单和内容大纲,采用适当的方法和工具进行采集。

大数据作为一种工具,用在什么地方、掌握在谁手里都是次要的,关键是看怎样利用这个工具。在安全的前提下,实现数据共享,真正创造数据价值,这才是大数据真正的目的。

3.Python语言是大数据可视化表达的高效工具

在大数据时代,复杂繁多且不同类型的数据大量涌来,往往超出了人们的处理能力,人类的大脑也难以从堆积如山的数据中快速发现核心问题,而数据可视化可以把枯燥乏味的海量数据以丰富的视觉效果呈现数据所反映的本质问题,有效提升数据分析的效率。大数据可视化是指以图形、图像、地图、动画等生动、易于理解的方式展示数据和诠释数据之间的关系、趋势与规律等,以便更好地理解数据。

大数据可视化可以让人们快速抓住要点信息,让关键的数据点从人们的眼睛快速通往、心灵深处。大数据可视化呈现的形式千变万化,实现的工具众多。其中,Python语言因其开源和包容的特

文档评论(0)

xiadaofeike + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8036067046000055

1亿VIP精品文档

相关文档