- 1、本文档共31页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[数据分析基本原理介绍基于excel
第一讲:数据分析基本原理介绍(基于excel工具) 主讲人:邓光耀 1、数据分析概述 1.1定义:数据也称观测值,是实验、测量、观察、调查等的结果,常以数量的形式给出。数据分析的目的是把隐没在一大批看来杂乱无章的数据中的信息集中、萃取和提炼出来,以找出所研究对象的内在规律。在实用中,数据分析可帮助人们作出判断,以便采取适当行动。数据分析是组织有目的地收集数据、分析数据,使之成为信息的过程。 1.2 通常需分析的数据有商务与经济数据、医药统计数据、游戏运行数据等。数据分析工作者需要有多学科背景,首先要对所分析的对象要有比较全面的了解。 1.3 数据分析的常规方法是用excel做统计表与统计图,专业方法有RFM模型、回归分析、时间序列分析、聚类分析、神经网络、正交设计、方差分析、结构方程模型、关联分析等。这些方法的具体内涵等用到时再讲。 1.4 常用的数据分析软件简介: spss软件是全球范围内最流行的数据分析软件;sas软件具有比较强大的编程功能,适合专业人士使用;eviews软件进行计量经济分析的人员用得比较多;dps软件是浙江大学唐启义发明的数据分析软件,它是目前唯一的中国人自己发明的数据分析软件,是spss软件与excel的山寨版;其它的数据分析软件还有gauss与minitab等。这些软件的基本功能都差不多,只是侧重点有些差别。 excel也有数据分析功能,对于一般的数据分析用excel也就足够了,本讲后面讲述excel函数与绘图功能。 1.5 数据分析的一般步骤: 1、数据的收集、整理、录入、校对等; 2、对收集的数据进行描述性统计分析,选择数据分析的方法。 3、利用已知数据建立模型,发现数据的内在规律,并利用模型对未来作出预测或者做出理性的决策。 4、比较预测的数据与现实数据,校正模型,提高预测的准确性或者做出更理性的决策。 2、判定数据计算错误的办法 2.1 在数据收集的过程中,或多或少会出现数据误差或者错误。数据校对工作者有必要掌握一些判定数据计算错误的办法。当然多算几次会提高计算的准确率,但是数据较多时,如何快速有效的判定计算的正误就需要一些专业的方法了。 2.2 位数估计与首位、末尾数据校对法:这是一个简单的办法,当你没有时间来校对数据时可以采用此法做些粗略的判断。 2.3 弃九法:此法的数学原理是利用同余的性质。我们先从例子开始叙述: 加法: 例1:假设商品一的销售金额为1568964元,商品二的销售金额为3625878元,统计表上两者的结果为5194742元,问此表有没有问题?我们计算1568964的各位数字的和,注意超过9就取除以9的余数即可,这样我们可以口算得到数字3,同理3625878可以用弃九法得到数字3,5194742用弃九法得到数字5,由于3+3=6不是5,故可以判定数据计算有误。 减法:我们可以先转化到加法,再用弃九法判断。 乘法: 例2:假设某件商品的单价是137元,销售量为128793件,经计算得判断此计算结果的正误。137用弃九法处理等于2,128793经处理等于3,那么2×3=6处理等于7,故可以判定数据计算失误。我们用正确的数据来验证弃九法的合理性,正确结果应该此数经弃九法处理等于6,满足弃九法。 除法:我们可以先转换到乘法,再用弃九法处理。 弃九法的数学原理:记 那么此数除以九之后所得余数与各位数字相加除以九之后得到的结果相同。即由于 最后一个式子表示两边除以九后的余数相同,是同余理论中的符号。 不知道听者有没有发现,用弃九法判断计算的正确性有时候失效,实质上用此法判断计算正误,如果判断计算是错误的,那么一定是计算错了,但是判断是正确的,却实质上计算不一定正确。例如上面的乘法的例子,如果我们计算得那么按照弃九法,不能判断出此结果是错误的,但是实质结果应当 不过由于出现计算错误的原因一般是忘记进位,或者用计算机计算时少输入一个数字等,故用弃九法来检验计算的正确性还是比较有效的。 3、描述性统计 3.1 频数与频率:频数指样本中某数据出现的次数;频率指频数除以样本的数目。 例3:我们分析下列数据: 上面数据中2出现的频数为3,频率为3/20=0.15。 我们在RFM模型中会遇到这样的数据组。 我们用excel函数求上面数据的频数与频率:假如我们依次把以上数据输入在A1到A20中,那么我们可以在B1中用countif函数计算2出现的频数,即输入=countif(A1:A20,2)即可得到2的频数为3;我们在B2中输入=B2/20或者=countif(A1:A20,2)/20即可。 注: 1.我们可以用=count(A1:A20)计算这组数
您可能关注的文档
- [清代诗词.ppt
- [数学期望.ppt
- [数学教学法-几何典型解法OK.ppt
- [数学必修5第一章--正余弦定理整合PPT.ppt
- [数学模型-市场经济中的蜘蛛网模型图片.ppt
- [数学毕业论文答辩ppt2.ppt
- [数学物理方程第四章二阶线性偏微分方程的分类与总结1.ppt
- [数学物理方法第五章傅里叶变换.ppt
- [清华ITJAVAEE教学PPT2.ppt
- [数学新课标在教学中的落实.ppt
- 2025年网络文学平台版权运营模式创新与版权保护体系构建.docx
- 数字藏品市场运营策略洞察:2025年市场风险与应对策略分析.docx
- 全球新能源汽车产业政策法规与市场前景白皮书.docx
- 工业互联网平台安全标准制定:安全防护与合规性监管策略.docx
- 剧本杀剧本创作审核标准2025年优化与行业自律.docx
- 2025年新能源电动巡逻车在城市安防中的应用对城市环境的影响分析.docx
- 全渠道零售案例精选:2025年行业创新实践报告.docx
- 2025年网约车司乘纠纷处理机制优化与行业可持续发展报告.docx
- 2025年宠物烘焙食品市场法规政策解读:合规经营与风险规避.docx
- 2025年宠物行业数据安全监管政策影响分析报告.docx
文档评论(0)