CH04 电子商务数据化运营管理.pptVIP

下载本文档

12
0
约1.92万字
约 89页
2016-08-21 发布于湖北
举报
版权申诉

CH04 电子商务数据化运营管理.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

CH04 电子商务数据化运营管理

END!!! * 国内电商（网购类）分为：供应链驱动型（京东、天猫、亚马逊）、传统型（苏宁国美百丽）、线上品牌型（凡客、梦芭莎）、O2O型（团购、旅游、家居建材）、垂直渠道型（好乐买、乐淘、红孩子）、虚拟型（苹果音乐商店、app store）、外贸型（国内特有）、代运营型（宝尊、兴长信达）、纯平台型（乐酷天） * * * Classification is a data mining technique used to predict a categorical or non-numeric value. The Regression mining technique is similar, in that it is a predictive technique, except it attempts to predict a numeric value. 对于保险行业，分类分析可以根据顾客的购买水平和基本特征对其进行分类，找出对企业有较大利润贡献的重要顾客特征，对其进行个性化、贵宾式的服务，提高其忠诚度。 * 回归分析（regression analysis）是一种基本的统计分析方法，它已被广泛地应用于数据挖掘领域。现实应用中变量之间存在着某种关系，这些变量之间的关系一般可以分为两类：一类是变量之间存在着完全确定的关系，即一个变量能被其他变量确定。另一类是变量之间存在某种程度的不确定关系，统计学把这种不确定关系称为相关关系。例如制造企业产品质量与各个生产因素之间存在一定的关系，可以分析这些关系以做出预测或确定最佳的作业条件。确定性关系和相关关系之间没有严格的界限。由于测量误差等原因，确定性关系可以通过相关关系表现。另一方面，通过对事物内部发展规律的深刻认识，相关关系又可能转化为确定性关系。两个变量之间的相关关系是不确定的，但可以通过不断观察，得到它们之间的统计规律。 * 根据回归分析涉及的自变量个数，可把回归分析分为一元回归分析和多元回归分析。而按照自变量和因变量之间的关系类型，可分为线性回归分析和非线性回归分析。 * 回归方程建立后还需要检验变量之间是否确实存在线性关系，因为对回归方程的求解过程事先并不知道两个变量是否存在线性相关关系。一元线性回归模型的统计检验可以用F检验法、t-检验法和r检验法等。 * A decision tree is a classification approach that uses the values of input variables to predict the value of a categorical variable. 决策树是由决策结点、分枝和叶子组成。其中每个内部结点表示在一个属性上的测试，每个分枝代表一个测试输出，而每个叶结点代表类，树的最顶层结点是根结点。沿决策树从上到下遍历的过程中，在每个结点都会遇到一个测试，每个结点上的测试输出导致不同的分枝，最后到达一个叶子结点，这个过程就是利用决策树进行分类的过程。 * 离散化是把连续型属性按一定标准划分为几个离散（分类型）值的过程：首先确定需要多少个离散值，再考虑如何把连续属性映射到这些离散值。因此连续属性离散化实际是选择分割点的个数和确定分割点位置的问题。离散化可以把连续属性分为若干区间，用不同符号映射每个区间的数值，减少连续属性的取值个数，便于后续分析。一般来说，离散化越细，得出的决策树就越复杂，预测的正确率可能提高，但会造成决策树分枝过多以及计算量的增加。 * 决策树可转化为一些分类规则，具有较好的解释性，从树根到树叶的每条路径都对应一个规则 * 为解决感知器非线性可分类问题，1986年美国的一个并行计算研究小组提出了著名的反向传播（back propagation，BP）算法，引发了神经网络的研究热点。此后有关神经网络的研究逐渐从实验室转向商用。目前，神经网络经常用于分类和聚类，作为一种重要的数据挖掘方法已在医学诊断、信用卡欺诈识别、手写体数字识别以及发动机的故障诊断等领域得到了广泛的应用。 * -神经网络有多种拓扑结构，其中在分类中比较常用的是多层、前馈（feed-forward）和全连接的BP神经网络。这种网络包括输入层、隐层和输出层，其中输入层的神经元数量取决于影响分类的属性个数和类型。隐层及其神经元的数量没有通用的规则确定，需要借助经验并通过实验比较才能设置合适的值。很多情况下取一层隐层即可满足要求。尽管较多的隐层神经元可以增强网络获取分类模式的能力，但过多的隐层神经元也会带来过拟合问题。输出层可以有一个或多个神经元，取决于具体的分类任务。 -每个神经元与下一层的所有神经元连接，但同层的神经元之间没有连接。 * Fraud Detection Customer Churn： Cust