PISA数据集数据可视化最终报告.PDFVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PISA 数据集数据可视化-最终报告 组员:何果财、秦晓东 1 简介 数据可视化主要旨在借助于图形化手段,清晰有效地传达与沟通信息,是数据挖掘领域 的重要研究方向,是一个极为活跃而又关键的方面。为了有效地传达思想概念,美学形式与 功能需要齐头并进,通过直观地传达关键的方面与特征,从而实现对于相当稀疏而又复杂的 数据集的深入洞察。数据可视化与信息图形、信息可视化、科学可视化以及统计图形密切相 关。一直以来,数据可视化就是一个处于不断演变之中的概念,其边界在不断地扩大;因而, 最好是对其加以宽泛的定义。数据可视化指的是利用图形、图像处理、计算机视觉以及用户 界面,通过表达、建模以及对立体、表面、属性以及动画的显示,对数据加以可视化解释。 本项目主要想解决的问题:通过有效的视觉可视化手段对复杂结构数据中蕴含的各种潜 在知识进行表达,数据可视化是一个数据分析和可视化迭代的过程。如图1 所示,数据准备 和数据分析是可视化的必备条件,而可视化又能反过来影响数据分析,改进数据分析的目标。 项目路径:/hegc/pisa_2012_visualization 图1:数据可视化流程和意义 2 问题描述 2.1 背景 PISA 是OECD 经济合作与发展组织的项目,主要对接近完成基础教育的15 岁学生进行 评估,测试学生是否掌握参与社会所需的知识与技能。2015 年的PISA,共有代表72 个国家 和地区的15 岁的五十万学生参加,此次项目在科学,数学,阅读,协作解决问题和金融知 识进行了评估。PISA 项目有大量的数据产生,OECD 也为此举办了数据可视化竞赛。 本项目的目标: (1) 对数据集提出一些问题。 (2) 使用数据分析方法,挖掘PISA 数据中蕴藏的知识。 (3) 进而使用数据可视化工具,将挖掘出的内容以视觉方式展现。 2.2 数据集 PISA 数据集是OECD 在全球范围内举办的青少年知识评估项目产生的,它主要包含一下 几个方面的数据: (1) 学生的问卷 (2 ) 学校的调查问卷 (3 ) 家庭的调查问卷 其中,数据的维度相当大,即字段非常地多,如学生的问卷数据就多达636 个。好在从 数据源获得的数据已经是结构化的,这简化了于我们的数据清洗工作。数据集共包含485490 学生的考察数据,主要包括学生成绩、家庭和学校情况三方面的数据。如图2 所示,数据量 比较大,但是下载下来的数据已经结构化处理,方便使用R 语言进行数据分析和建模。 图2:整个PISA 项目的数据集,dict 是字段的解释文件 2.3 预期成果 我们将从成绩与学校因素的关系和成绩与其它因素两个方面进行讨论。其中,与学校相 关的因素有:教师水平、计算机多媒体设备、图书馆、学生入学时间、授课方式等等。其它 因素主要包括性别、国家地区、学科、书籍等等。 3 技术方案 首先我们要对数据集提出一些问题,问题应该在数据集中有所体现。针对提出的问题, 我们对数据进行分析,然后绘制可视化的图表,视觉化地展现对问题的解答。 4 实现与实验结果 下面,我们将按照提出问题,分析数据,可视化展示来进行实验,并进行实验结果的展 示。 4.1 学校相关因素对成绩影响 1. 学校和家庭的支持对学生成绩的影响? 图3:学生成绩与家庭和学校支持的关系 2. 逃学率与数学成绩的关系 图4 :学校逃学率与平均数学成绩的关系 根据图4 可以看到,逃学率与数学成绩基本呈负相关,当然也有部分离群点(中国), 逃学率高反而数学成绩很好。 3. 数学老师的缺乏对数学成绩的影响? 图5:缺乏数学老师对学生成绩的影响 根据图5 可以看到,对于大多数国家,数学老师的缺乏会降低学生的数学成绩,符合我 们的常识。 4. 学生入学时间对数学、阅读、科技学科的成绩影响? 图6:学生阅读成绩与上学年纪的关系 图7 :学生数学成绩与上学年纪的关系 图8 :学生科学题成绩与上学年纪的关系 根据图6、7、8,

文档评论(0)

jjwhy + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档