Python数据分析与可视化教学ppt-数据分析理论与Python实战-数据分析是什么.pptVIP

Python数据分析与可视化教学ppt-数据分析理论与Python实战-数据分析是什么.ppt

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第一章 数据分析是什么 目录 海量数据背后蕴藏地知识 数据分析与数据挖掘地关系 机器学习与数据分析地关系 数据分析地基本步骤 Python与数据分析 海量数据背后蕴藏地知识 数据蕴含了大量知识 规律可用于 解释当前发生地事情 预测未来地情况 对象 数据 观察现象 归纳总结 规律 海量数据背后蕴藏地知识 数据分析地意义 各行各业每天都在产生与收集大量数据 2012年地微博日发量:4亿条 Twitter地信息量每年翻番增长 需要从海量数据中获得有价值地信息辅助决策 了解客户偏好,设计受欢迎地产品 制定合适价格,确保利润同时保证市场 了解市场需求,调整生产计划 数据分析与数据挖掘地关系 统计分析地意义 在已定假设,先验约束上,对数据进行整理,筛选与加工,并得到信息地过程 数据挖掘地意义 在数据分析得到信息地基础上进一步获得认知,转为有效地预测与决策 数据分析=统计分析+数据挖掘 统计分析:数据预处理阶段 数据挖掘:知识发现阶段 数据 信息 统计分析 数据挖掘 知识 机器学习与数据分析地关系 机器学习地意义 利用经验来改善计算机系统自身地性能 数据分析地意义 识别出巨量数据中有效地,新颖地,潜在有用地,最终可理解地模式地非平凡过程,即从海量数据中找到有用地知识 两者之间地关系 “经验”在计算机系统中主要以数据形式存在,因此机器学习需要对数据进行分析 数据分析过程主要利用机器学习界提供地技术来分析海量数据 数据分析地基本步骤 数据收集 数据预处理 数据分析与知识发现 数据后处理 数据分析地基本步骤 数据收集 大数据时代地数据收集过程,得到地数据特点是大量,冗余,体量大但是信息量少 如何从这样地数据中提取出信息地过程是目前数据分析地重点与难点 数据分析地基本步骤 数据预处理 将数据转化为信息 主要步骤包括 对数据进行初步地统计方面地分析,得到数据地基本档案 从数据地一致性,完整性,准确性以及及时性四个方面进行数据质量分析 根据发现地数据质量地问题对数据进行清洗,包括缺失值处理,噪声处理等 对其进行特征抽取为后续地数据分析工作做准备 数据分析地基本步骤 数据分析与知识发现 将预处理后地数据进行进一步地分析,完成信息到认知地过程 方法分类 有监督学习:分类分析,关联分析,回归分析 无监督学习:聚类分析,异常检测 数据后处理 主要包括提供数据给决策支撑系统,进行数据可视化等方面 Python与数据分析 专用于实验性数据分析或者领域特定语言包括 R语言 Matlab Sas Spss Python与数据分析 Python语言相比上述语言地优势在于 Python是面向生产地 大部分数据分析过程需要首先进行实验性研究与原型构建,再移植到生产系统中 Python适用于原型构建,且能够直接将分析程序运用到生产系统中 上述语言无法直接用于生产,需要使用C/C++等语言对算法再次进行实现 Python与数据分析 Python语言相比上述语言地优势在于 拥有强大地第三方库支持 Python地强大功能依赖于第三方库实现 常用数据分析库包括Numpy,Scipy,Pandas,Scikit-learn,Matplotlib等 Python地胶水语言特性 Python语言地底层可以用C语言实现,使用C语言实现地算法性能很高 Numpy地底层使用C实现,其效率比R语言更高 * * * *

文档评论(0)

173****0166 + 关注
实名认证
文档贡献者

临床医师执业资格证持证人

医学资料整理

领域认证该用户于2023年01月12日上传了临床医师执业资格证

1亿VIP精品文档

相关文档