- 1、本文档共286页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
根据相关教材和网络资源整理制作,可作为授课教师的参考资料和专业学生、从业人员的自学资料。如有侵权,请联系删除!
第一章数据分析与可视化基础知识
序言PREFACE 常言道,工欲善其事,必先利其器。在数据是资源的时代,人人事事均要靠数据说话,应用计算机进行数据分析与可视化处理已经遍布于人类工作、学习与生活之中。掌握“数据分析与可视化”技术,可以有效构建与提升人类的数据思维及计算机的应用能力。本章以理论结合实践的形式,探讨数据思维在大数据时代的作用及应用,讨论数据分析中的数据到底从何而来、如何针对不同的行业选择不同的数据分析方法、可视化与数据分析之间的关系等,掌握数据分析方法和数据可视化方法应用与实践。
PART 01 数据分析PART 02 数据可视化目录CONTENTS
数据分析1PART 01
Google首席经济学家、UC Berkeley大学Hal Varian教授指出:“数据正在变得无处不在、触手可及;而数据创造的真正价值,在于我们能否提供进一步的稀缺的附加服务,这种增值服务就是数据分析。”未来人们的决策将日益依赖于数据分析的结果,而非单纯的经验和直觉。整体来看,知识的演进层次,可以双向演进。从噪音中分拣出来数据,转化为信息,升级为知识,升华为智慧。数据的背后隐藏着信息,而信息之中蕴含着知识和智慧.大数据作为具有潜在价值的原始数据资产,只有通过深入分析才能挖掘出所需的信息、知识以及智慧。数据分析的认知
DIKW知识体系DataInformationKnowledgeWisdom信息是经过加工处理的数据,信息可以看作是数据的解释,是能够对接收者行为产生影响的数据,它可以用于回答特定的问题。智慧是合理的运用知识并进行正确决策、判断的能力。智慧关注的是未来发生的事情,是运用历史的和正在发生的知识去预测、判断未来即将发生的事情。数据是我们身边一切可以感知的、可以被识别的各种形象的符号或者抽象的声音、气味等,数据本身无法回答任何问题,或者说数据本身没有任何具体意义。知识则更进一步,是对信息的应用,知识体现了信息的本质,是对信息集合进行提炼、综合的基础上,获得的经验、判断和理解。
数据分析的定义数据分析是将数学、统计学理论结合科学的统计分析方法(如线性回归分析、聚类分析、方差分析、时间序列分析等)对数据库中的数据、Excel数据、收集的大量数据、网页抓取的数据等进行分析,从中提取有价值的信息形成结论并进行展示的过程。数据分析的目的在于将隐藏在一大堆看似杂乱无章的数据背后的有用信息提取出来,总结出数据的内在规律,以帮助在实际工作中的管理者做出决策和判断。
数据分析的意义在互联网行业,通过数据分析可以根据客户意向进行商品推荐以及有针对性的投放广告等。在网络安全方面,可以通过数据分析建立一个潜在攻击性的分析模型,监测大量的网络访问数据与访问行为,可以快速地识别出可疑网络的访问,起到有效的防御作用。在医学方面,可以实现智能医疗、健康指数评估以及 DNA 对比等。在个人生活方面,数据分析可以对个人生活习惯进行分类,为其提供更加周到的个性化服务等。在交通方面,可以根据交通状况数据与GPS定位系统有效地预测交通实时路况信息。在通信方面,数据分析可以统计骚扰电话,进行骚扰电话的拦截与黑名单的设置。数据分析是大数据技术中最重要的一部分,随着大数据技术的不断发展,数据分析将应用于各个行业。
数据分析的意义例如,某公司2021年上半年销售收入,如图。作为企业管理者从中可能会得出结论:2021年上半年公司销售业绩稳步增长,公司运营状况良好。但是进一步分析发现,2021年上半年公司销售业绩持续稳步增长的同时,销售成本也大幅度增加,如图所示,公司运营状况是否良好呢?目前无法给出结论。
数据分析的意义公司经营活动的目的是获得利润,管理者需要对经营活动进行毛利分析,才能确认“公司经营状况良好”结论是否成立。2021年上半年销售毛利对比毛利率,如图所示,从图中很容易看出3月至6月期间销售毛利额维持不变,毛利率持续下降,3月份下降幅度超过50%。如果这家公司当前的核心目标是提升市场份额,在此期间公司投入大量费用进行产品推广和促销,那么出现这样的毛利率下降就属于正常现象,符合公司扩大市场份额的短期目标。否则毛利率下降就是公司经营出现问题的预警信号,公司管理者应该在保证实现销售业绩增长的同时严格控制销售成本,以期获得更大的利润。
数据分析方法侧重于在数据中探索发现数据特征和规律,它是对传统统计学假设检验手段的有益补充。探索性数据分析描述性数据分析是最基础、最初级的,例如,本月收入增加了多少、客户增加了多少、哪个单品销量好都属于描述性数据分析。描述性数据分析验证性数据分析已经确定使用哪种假设模型,通过验证性数据分析来对你的假设模型进行验证。
数据分析方法以建模理论为主,包括回归分析法、聚类分析法、相关分析法、矩阵分析法、判别分析法、主成分分析法、因子分析法、对应分
文档评论(0)