- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
(2) 在线数据分析平台 图 3.18 在线数据分析平台示例 (3) 数据分析语言 Python语言 R语言 MATLAB语言 在对数据进行分析时,Python语言具有较强的网络数据获取优势,还可调用丰富的工具库。例如,Numpy库中的sum()、mean()、 min()、max()和Pandas库中的value_counts()等都是可以用于统计的函数。 R语言和 MATLAB语言依靠其独特的功能在相关专业领 域使 用 得 更 为 广 泛。例 如,R 语 言 在 统 计 学 领 域 使 用 较 多 R语言和 MATLAB语言依靠其独特的功能在相关专业领 域使 用 得 更 为 广 泛。例 如,MATLAB语言则在工程计算等领域更受欢迎。 二、数据可视化 1. 数据可视化的基本工具 电子表格软件中的图表功能可以 基于选定的数据,用柱形图、折线图、饼图等方式呈现出来。创建图表 后,可以通过修改数据标记、图例、标题、文字等来美化图表或强调某些信息,也可以用图案、颜色、对齐方式、字体及其他格式属性来对图 表进行设置。 电子表格软件的数据可视化过程直观、易用,但是对于大量数据可视化的实现就比较困难了。 当数据量较大时,可以使用编程语言对这些数据进行可视化。 Python语言中,Matplotlib是一种应用较广的绘图工具包,使用其中 的pyplot子库所提供的函数可以快速绘制图形,并能使用标签进行修 饰,从而制作出高质量的数据分析图。 Python语言中,引入 Matplotlib的pyplot子库的语法为: pyplot绘制图形有一个基本流程: 创建画布与创建子图 添加画布内容 保存与显示图形 表 3.8 pyplot中创建画布以及创建并选中子图的常用函数 表 3.9 pyplot中添加各类标签和图例的常用函数 表 3.10 pyplot中保存和显示图形的常用函数 图 3.21 绘制不含子图的 图形 2. 常用的数据分析图 (1) 分析特征间的关系 散点图和折线图是数据分析最常用的两种图形。这两种图形都能够分析不同数值型特征间的关系。其中,散点图主要用于分析特征 间的相关关系,折线图则用于分析自变量特征和因变量特征之间的趋 势关系。 散点图(scatterdiagram)又称为散点分布图,是以一个特征为横坐标,以另一个特征为纵坐标,利用坐标点(散点)的分布形态反 映特征间统计关系的一种图形。散点图中,值由点在图中的位置 表示。 图 3.22 绘制简单的散点图 图 3.23 绘制折线图 (2) 分析特征内部数据分布与分散状态 柱状图、饼图和箱形图是数据分析常用的另外三种图形,主要用 于分析数据内部的分布状态与分散状态。柱状图主要用于查看各分组数据的数量分布以及各分组数据之间的数量比较。饼图倾向于查 看各分组数据在总数据中的占比。箱形图的主要作用是发现整体数 据的分布、分散情况。 本章学习目标 ? 通过典型的应用实例,了解数据采集和整理的基本方法,理解数据安全的重要性。 ? 选用合适的软件工具或平台处理数据,掌握数据可视化的基本方法。 ? 了解数据分析报告的结构形式,完成解决问题的数据分析报告,感悟数据分析的价值 项目主题 交通数据利抉择 项·目·情·境 共享单车的诞生,顺应了“绿色出行”的环保理念,解决了人们出行“最后一公里”的烦恼。但与此同时,又有新的问题浮出水面。 小申是一名“优秀志愿者”,他的服务岗位是学校附近的共享单车站点。因为 学校周边还有地铁站、图书馆等,所以小申服务的站点的共享单车租放量很大。有时共享单车太多而挤占了人行道,有时人多而共享单车却供不应求,小申看在眼里 急在心里。共享单车使用的“潮汐”难题如何破解呢? 项·目·任·务 任务1 任务2 任务3 利用信息技术工 具收集共享单车使用 过程中的相关数据,形 成数据集。 学习数据处理的 常用工具和方法,对数 据集进行整理,用可视 化方式呈现出来。 应用项目活动中 的数据处理结果,以小 组为单位撰写数据分 析报告,交流分享学习成果。 课 堂 导 入 当今社会,信息技术开始渗透至人类日常生活的方方面面,随之而产生的数据量也呈现指数级数增长的态势,例如物联网传感器、社交网络等每时每刻都产生着大量的数据。面对数据量的快速增长及 变化、数据来源的多元化、数据呈现方式的多样化,我们在遵守相关法 律法规、尊重知识产权的前提下,有效地采集与整理数据是进行数据处理的基础。 一、数据采集 数据来源 传感设备 互联网 企业内部数据库等途径 问卷调查 (1)获取网页 (2)解析网页 (3)
您可能关注的文档
- 1-1数据及其特征 课件 高中信息技术粤教版必修1.ppt
- 1-2 数据、信息、知识 课件浙教版高中信息技术必修1.ppt
- 1-2数据编码-1 课件 高中信息技术粤教版必修1.ppt
- 1-2数据编码-2 课件 高中信息技术粤教版必修1.ppt
- 1-2数据编码-3 课件 高中信息技术粤教版必修1.ppt
- 1-2信息系统的组成与功能 课件浙教版高中信息技术必修2.ppt
- 1-3数据采集与编码(一) 课件浙教版高中信息技术必修1.ppt
- 1-3信息系统的应用 课件浙教版高中信息技术必修2.ppt
- 1-4-信息社会及其发展 课件浙教版高中信息技术必修2.ppt
- 2-1-1计算机硬件组成 课件浙教版高中信息技术必修2.ppt
文档评论(0)