Python人工智能技术与应用 PPT课件 6.【课件】2-3 Python 数据探索性分析.pptx

Python人工智能技术与应用 PPT课件 6.【课件】2-3 Python 数据探索性分析.pptx

  1. 1、本文档共34页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

《Python人工智能技术与应用》能力模块二掌握Python人工智能的基础应用任务三Python数据探索性分析

TaskImport任务导入解决了产品开发和数据来源的问题,BI产品的最后一步是进行数据探索性分析,通过对数据进行探索,更好地理解客户、发现业务机会、帮助决策制定等。作为该商业咨询公司商业智能团队中的Python数据分析师,你的主要职责是使用Python编程语言和数据分析工具来处理和分析大量数据,具体包括数据清洗和预处理、数据分析和建模、可视化和报告等,现在需要你通过使用Python脚本在该BI产品中对数据进行探索性分析,确定影响汽车销售量价格、保险费用等关键因素,了解汽车市场的潜在需求和趋势,为汽车市场研究和市场策略制定提供支持。

素养目标引导问题的过程中,培养学生形成勤于思考的能力获得分析解决问题以及多元化思考解决问题的方法,形成创新意识。TaskObject任务目标知识目标了解数据探索性分析的定义。了解数据探索性分析的流程。了解Python实现数据探索性分析的常用库。能够判断数据集特征的类别。技能目标掌握使用matplotlib实现对不同类别数据的可视化。掌握使用numpy库、Pandas库实现对数据的缺失值、异常值、变量相关关系的洞察.能够思考并确定对汽车产品数据探索性分析的思路。在实践中培养决策分析的职业能力。

新授

Python实现数据探索性分析的常用库05CONTENTS目录汽车产品数据探索性分析项目实现06数据探索性分析技术认知01数据分类02数据可视化03洞察数据04

01数据探索性分析技术认知数据探索性分析主要用于查看哪些数据可以揭示超出常规建模或假设检验任务的洞察,帮助更好地理解数据集变量以及它们之间的关系;数据探索性分析是成功实现人工智能与机器学习的第一步;数据是用来描述特定事物或概念的信息,可以是文本、数字、图像或其他形式的信息;探索性数据分析被数据科学家用于分析和调查数据集并总结其主要特征,通常采用数据可视化方法;

01数据探索性分析技术认知探索报表数据的趋势

数据分类02数据探索性分析步骤探索性数据分析的过程大致分为3步:数据分类、数据可视化、洞察数据。

数据分类02在数据科学领域,一般将数据分为结构化数据和非结构化数据。而对应地,非表格形式组织的都是非结构化数据。例如:文本、图片、视频等。世界上20%数据是结构化数据,80%的数据是非结构化数据。非结构化数据结构化数据指的是能够用表格来组织的数据。例如:Excel里的数据、数据库MySQL里的数据等。结构化数据结构化数据VS非结构化数据

数据分类02结构化数据结构化数据定类等级定比等级定序等级定距等级定性数据定量数据

数据分类02结构化数据在定类等级的基础上加了自然排序,这样我们就可以对不同数据进行比较。例如:餐厅的评星,公司的考核等级。定序等级是数据的第一个等级,其结构最弱。只需要按照名称来分类。例如:血型(A,B,AB,O)、姓名、颜色。定类等级数据的4个等级示意

数据分类02结构化数据是在定距等级的基础上,加入了绝对零点,不但可以做加减的运算,还可以做乘除的运算。例如:金钱、重量。定比等级一定是数值类型的,并且这些数值不仅可以用来排序,还可以用来加减。例如:华氏度、摄氏度(温度有负数,不可以进行乘除运算)。定距等级数据的4个等级示意

数据可视化03数据可视化是一种将数据抽象成图表或图形的过程,它可以帮助人们更容易理解数据,从而更快捷地分析出数据中的趋势和模式。用于表示一组数据的分布情况,可以很直观地看出每个分组所占的比例。饼图

数据可视化03数据可视化是一种将数据抽象成图表或图形的过程,它可以帮助人们更容易理解数据,从而更快捷地分析出数据中的趋势和模式。用于表示一组数据的分布情况,可以很直观地看出每个分组的大小。条形图

数据可视化03数据可视化是一种将数据抽象成图表或图形的过程,它可以帮助人们更容易理解数据,从而更快捷地分析出数据中的趋势和模式。用于表示两个变量之间的关系,比如时间与价格之间的关系或者不同产品之间的销量关系。拆线图

数据可视化03数据可视化是一种将数据抽象成图表或图形的过程,它可以帮助人们更容易理解数据,从而更快捷地分析出数据中的趋势和模式。箱线图是一种用于表示数据分布情况的图表,它由一个箱子和两条线组成箱线图

03不同数据等级对应的可视化方法数据可视化数据等级属性描述性统计图表定类离散、无序频率占比、众数条形图、饼图定序有序类别、比较频率、众数、中位数、百分位数条形图、饼图定距数字差别有意义频率、众数、中位数、均值、标准差条形图、饼图、箱线图定比连续均值、标准差条形图、曲线图、饼图、箱线图

04缺失值:如果数据中存在缺失值,可能会导致模型的结果不准确,或

您可能关注的文档

文档评论(0)

lai + 关注
实名认证
内容提供者

精品资料

版权声明书
用户编号:7040145050000060

1亿VIP精品文档

相关文档