数据服务--数据分析.pptxVIP

下载本文档

37
0
约2.87千字
约 20页
2019-09-23 发布于福建
举报
版权申诉

数据服务--数据分析.pptx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

数据服务数据分析方法数据分析指用适当的统计分析方法对收集来的大量数据进行分析，提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。在统计的基础上，查找数据群体特征；简而言之：就是对群体数据的描述、判别、预测、决策的过程。01描述性数据分析02诊断性数据分析03预测性数据分析目录CONTENTS04指令性数据分析01PART ONE描述性数据分析描述性数据分析常用指标描述性数据分析属于比较初级的数据分析，常见的分析方法包括对比分析法、平均分析法、交叉分析法等。描述性统计分析要对调查总体所有变量的有关数据做统计性描述，主要包括数据的集中趋势分析、数据离散程度分析、数据的分布、以及一些基本的统计图形等。描述性分析是对数据进一步分析的基础。均值、中位数、众数体现了数据的集中趋势。极差、方差、标准差体现了数据的离散程度。偏度、峰度体现了数据的分布形状。描述性数据分析图形数据可视化主要旨在借助于柱状图、饼图、散点图、折线图等图形化手段，清晰有效地传达与沟通信息。目的是简化信息、突出重点。展示方式文本表格excel、wps等表格输出复杂的数据、数据关系等；合计、同比、环比等；时间4月上旬4月中旬4月上旬5月上旬乘车人次181217992080262402PART TWO诊断性数据分析诊断性数据分析描述性数据分析的下一步就是诊断性数据分析。通过评估描述性数据，诊断分析工具能够让数据分析师深入地分析数据，钻取到数据的核心。按照时间序列进行数据读入、特征过滤和钻取数据等，以便更好的分析数据。诊断分析的目标是了解事情发生的原因。例如，二七广场的人流量，工作日约为20万，周末约为30万，假期为35万，就需要对人流量进行多维度分析，进行分类或聚类，进而得出几个人流量特征（逛街、购买物品、游玩、乘火车路过、工作等），然后分析每个特征对人流量的影响度。诊断性数据分析-常见模型相关模型因子模型研究两个或两个以上处于同等地位的随机变量间的相关关系的统计分析方法。例如，人的身高和体重之间；空气中的相对湿度与降雨量之间的相关关系都是相关分析研究的问题。因子分析的基本目的就是用少数几个因子去描述许多指标或因素之间的联系，即将相关比较密切的几个变量归在同一类中，每一类变量就成为一个因子，以较少的几个因子反映原资料的大部分信息。运用这种研究技术，我们可以方便地找出影响消费者购买、消费以及满意度的主要因素是哪些，以及它们的影响力。诊断性数据分析-常见模型聚类模型k-means算法中的k代表类簇个数，means代表类簇内数据对象的均值（这种均值是一种对类簇中心的描述），因此，k-means算法又称为k-均值算法。k-means算法是一种基于划分的聚类算法，以距离作为数据对象间相似性度量的标准，即数据对象间的距离越小，则它们的相似性越高，则它们越有可能在同一个类簇。数据对象间距离的计算有很多种，k-means算法通常采用欧氏距离来计算数据对象间的距离。邻近算法，或者说K最近邻(KNN，k-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一。所谓K最近邻，就是k个最近的邻居的意思，说的是每个样本都可以用它最接近的k个邻居来代表。一组将研究对象分为相对同质的群组的统计分析技术。聚类分析也叫分类分析，或者数值分类。聚类的输入是一组未被标记的样本，聚类根据数据自身的距离或者相似度将其划分成若干个组，划分的原则是组内距离最小化而组间（外部）距离最大化。聚类和分类的不同在于：聚类所要求划分的类是未知的。03PART THREE预测性数据分析预测性数据分析作用决策管理决策管理是用来优化并自动化业务决策的一种卓有成效的方法。它通过预测分析让企业能够在制定决策以前有所行动，以便预测哪些行动在将来最有可能获得成功。滚动预测可以对业务绩效进行前瞻性预测；为未来计划周期提供一个基线；捕获变化带来的长期影响；与静态年度预测相比，滚动预测能够在觉察到业务决策制定的时间点得到定期更新预测分析是一种统计或数据挖掘解决方案，包含可在结构化和非结构化数据中使用以确定未来结果的算法和技术。可为预测、优化、预报和模拟等许多其他用途而部署，也可为规划流程提供各种信息预测性数据分析-常见模型时间序列模型时间序列分析的主要目的是根据已有的历史数据对未来进行预测。时间序列预测法可用于短期预测、中期预测和长期预测。根据对资料分析方法的不同，又可分为：简单序时平均数法、加权序时平均数法。简单平均数法：也称算术平均法。即把若干历史时期的统计数值作为观察值，求出算术平均数作为下期预测值。加权平均数法：把各个时期的历史数据按近期和远期影响程度进行加权，求出平均值，作为下期预测值。预测性数据分析-常见模型回归模型回归是一种运用广泛的统计分析方法，可以通过规定因变量和自变量来确定变量之间的因果关系，建