- 1、本文档共17页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
项目一
Python数据分析概述《财务大数据分析》课程JIANGSUVOCATIONALCOLLEGEOFINFORMATIONTECHNOLOGY江苏信息职业技术学院财务大数据分析课程团队
目录任务一认识数据分析任务二Python数据分析的工具?JIANGSUVOCATIONALCOLLEGEOFINFORMATIONTECHNOLOGY江苏信息职业技术学院
1.掌握广义的数据分析和狭义的数据分析的概念;
2.掌握典型的数据分析流;
3.了解七大类常见的数据分析应用场景;
4.了解数据分析常用的Python、R和MATLAB工具;
5.了解使用Python工具进行数据分析的优势;
6.了解7个Python数据分析常用类库。学习任务JIANGSUVOCATIONALCOLLEGEOFINFORMATIONTECHNOLOGY江苏信息职业技术学院
任务一
认识数据分析?JIANGSUVOCATIONALCOLLEGEOFINFORMATIONTECHNOLOGY江苏信息职业技术学院
数据分析的概念一大数据是一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。大数据是一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合具有海量的数据规模快速的数据流转多样的数据类型价值密度低四大特征
数据分析的概念一数据分析是指用适当的分析方法对收集来的大量数据进行分析,提取有用信息和形成结论,对数据加以详细研究和概括总结的过程。随着计算机技术的全面发展,企业生产、收集、存储和处理数据的能力大大提高,数据量与日俱增。而在现实生活中,需要把这些业务部门繁多、复杂的数据通过统计分析进行提炼,以此研究出数据的发展规律,进而帮助企业管理层做出决策。
一数据分析的概念广义的数据分析包括狭义数据分析和数据挖掘。狭义的数据分析是指根据分析目的,生产部门采用对比分析、分组分析、交叉分析和回归分析等分析方法,对收集的数据进行处理与分析,提取有价值的信息,发挥数据的作用,得到一个特征统计量结果的过程。
数据挖掘则是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,通过应用聚类模型、分类模型、回归和关联规则等技术,挖掘潜在价值的过程。一数据分析的概念
数据分析已经逐渐演化为一种解决问题的过程,甚至是一种方法论。虽然每个公司都会根据自身需求和目标创建最适合的数据分析流程,但数据分析的核心步骤是一致的。数据分析的流程二需求分析一词来源于产品设计,主要是指从用户提出的需求出发,挖掘用户内心的真实意图,并转化为产品需求的过程。产品设计的第一步就是需求分析,也是最关键的一步,因为需求分析决定了产品方向。错误的需求分析可能导致在产品实现过程中走入错误方向,甚至对企业造成损失。数据分析中的需求分析是数据分析环节的第一步,也是非常重要的一步,决定了后续的分析方向和方法。数据分析中的需求分析的主要内容是,根据业务、生产和财务等部门的需要,结合现有的数据情况,提出数据分析需求的整体分析方向、分析内容,最终和需求方达成一致意见。(1)需求分析
(2)数据获取网络数据本地数据二数据分析的流程数据获取是数据分析工作的基础,是指根据需求分析的结果提取、收集数据。数据获取主要有两种方式:网络数据是指存储在互联网中的各类视频、图片、语音和文字等信息;本地数据则是指存储在本地数据库中的生产、营销和财务等系统的数据。本地数据按照数据时间又可以划分为两部分:历史数据与实时数据。历史数据是指系统在运行过程中遗存下来的数据,其数据量随系统运行时间的增加而增长;实时数据是指最近一个单位时间周期(月、周、日、小时等)内产生的数据。
(3)数据预处理数据预处理是指对数据进行数据合并、数据清洗、数据标准化和数据变换,并直接用于分析建模的这一过程的总称。其中,数据合并可以将多张互相关联的表格合并为一张;数据清洗可以去掉重复、缺失、异常、不一致的数据;数据标准化可以去除特征间的量纲差异;数据变换则可以通过离散化、哑变量处理等技术满足后期分析与建模的数据要求。在数据分析的过程中,数据预处理的各个过程互相交叉,并没有明确的先后顺序。二数据分析的流程
(4)分析与建模分析与建模是指通过对比分析、分组分析、交叉分析、回归分析等分析方法,以及聚类模型、分类模型、关联规则、智能推荐等模型与算法,发现数据中的有价值信息,并得出结论的过程。二数据分析的流程
二数据分析的流程分析与建模的方法按照目标不同可以分为几大类。如果分析目标是描述客户行为模式的,可采用描述型数据分析方法,同时还可以考虑关联规则、序列规则和聚类
您可能关注的文档
- 财务大数据分析 课件 项目四任务四 财务数据分析的基本步骤.pptx
- 财务大数据分析 课件 项目四任务一 财务数据分析的涵义.pptx
- 财务大数据分析 课件 项目五任务二 资产负债数据水平分析.pptx
- 财务大数据分析 课件 项目五任务三 资产负债数据垂直分析.pptx
- 财务大数据分析 课件 项目五任务四 资产负债数据主要项目分析.pptx
- 财务大数据分析 课件 项目五任务一 资产负债数据结构分析.pptx
- 财务大数据分析 课件 项目一任务二 Python数据分析的工具.pptx
- 资产评估学教程 练习答案汇总 (1--9) 龚菊明 .docx
- 资产评估学教程——练习答案 (1).docx
- 资产评估学教程——练习答案 (2).docx
- (高清版)DB43∕T 2479-2022 湘西黄牛种公牛选育技术规程.pdf
- (高清版)DB43∕T 2586-2023 水稻镉积累特性池栽表型鉴定技术规程.pdf
- (高清版)DB43∕T 2529-2022 可循环快递包装应用规范.pdf
- (高清版)DB43∕T 2511-2022 应急救援直升机起降点建设规范.pdf
- (高清版)DB43∕T 2491-2022 壶天石羊饲养管理技术规范.pdf
- (高清版)DB43∕T 2437.1-2022 知识产权综合服务分中心运行规范 第1部分:总则.pdf
- (高清版)DB43∕T 2594-2023 桃园增施有机肥减施化肥技术规程.pdf
- (高清版)DB43∕T 2470-2022 设施辣椒根结线虫病绿色防控技术规程 .pdf
- (高清版)DB43∕T 2604-2023 葡萄计划密植栽培技术规程 .pdf
- (高清版)DB43∕T 2558-2023 城镇低效用地识别技术指南.pdf
文档评论(0)