- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
3. 数据分析及可视化 天气情况对空气质量的影响 (3)AQI·气温·晴雨 下雨天多发生在气温较高区段,在低温区段重度污染以上发生的频率更高一些,而下雨天的空气质量指数多集中在平均值下方,优良居多。 4. 分析图表整合与互动 空气污染情况分析仪表板 整合工作表“空气污染率统计”、“空气质量饼图”和“首要污染物”到仪表板,可添加筛选器、突出显示等操作,实现互动。 5.3 唐诗可视化分析案例 5.3.1 背景介绍和提出问题 《全唐诗》是清康熙年间编校的一本唐诗合集,从数据分析的角度 “探索”全唐诗,寻找以下问题的答案: 全唐诗中收录的哪位诗人的诗最多?杜甫、白居易还是李白? 古人作诗时喜欢用那些汉字?全唐诗中出现频率较高的字是那些? 诗人最喜欢描写哪个季节? 随意输入一段内容,可否快速找到含有该内容的古诗? 5.3.2 数据准备 全唐诗.xlsx(42986首古诗) id(编号) volume(第几卷) sequence(所在卷的第几篇) title(古诗标题) author(古诗作者) text(古诗内容) 字频统计-全唐诗.csv(7520个汉字) number(编号) word(字) frequency(字频) 5.3.3 数据分析及可视化 连接数据源 5.3.3 数据分析及可视化 谁的诗收录的最多全唐诗中收录的诗集最多的前三名分别是白居易、杜甫和李白 5.3.3 数据分析及可视化 古人作诗时的常用字(前50个高频字的词云图) 通过参数来控制所希望显示的高频字的个数 5.3.3 数据分析及可视化 描写最多的季节是哪个-古人最青睐的季节通过分析发现古人独爱春,在四个季节的描写中,对春的描写占比超过50% 5.3.3 数据分析及可视化 诗歌搜索 在查询内容中输入“静夜思” 3.2 数据表 5.1.4 数据可视化 ①将“比较”字段拖动到“行”标签功能区,将“等第”字段拖动到“列”标签功能区。 ②将“等第”拖动到“标记”组的“文本”按钮上,并点击三角形的下拉式按钮,在“度量”中选择“计数”。 ③将“比较”字段拖入到筛选器时会弹出“筛选器[比较]”窗口,其中在“常规”选项卡里选择“使用全部”,如图5-1-21所示。 图5-1-21 将“比较”字段拖入筛选器时在“常规”选项卡中的设置 5.1.4 数据可视化 ④在“筛选器”窗口的“比较”字段右侧的“三角下拉式按钮”中点击“显示筛选器”。在窗体右侧的 “比较选择”窗口默认选项为“学院”,此时工作表中显示如图5-1-22所示。 图5-1-22 筛选器字段设置为“显示参数”后,“比较选择”默认为“学院” 5.1.4 数据可视化 ⑤在参数组的“比较选择”的字段选项上点击右侧的“三角形”下拉式按钮,在弹出的菜单上选择“显示参数控件”,则在数据表中会显示“比较选择”下拉式列表。如图5-1-23所示。 图5-1-23 “参数”组中为“比较选择”设置“显示参数控件” 5.1.4 数据可视化 ⑥当在右侧“比较选择”列表中分别选择“年级”或“性别”选项后,“比较”选项中勾选相应的选项,在工作表的图表区会做相应的改变。并且通过拖动将列坐标的“等第值”调整为如图5-1-24所示的顺序。同时设置工作表标签的文字与格式,样式同前所述。 图5-1-24 15-17级等级考试各等第人数综合统计 5.1.4 数据可视化 (6)添加一张新的工作表,仿造图5-1-24所示,建立“ 15-17级学生各等第合格与优秀率统计”工作表。步骤与“15-17级等级考试各等第人数综合统计”工作表完全相似。 只是在“标记”组上选中“计数(等第)”选项,点击窗体最上方菜单栏中“分析”菜单,选择“百分比”选项中的“行”选项,并按样张设置当前工作表标题,再调整工作表中字段顺序,结果参照图5-1-25。 图5-1-25 15-17级学生各等第合格与优秀率统计 选中“计数(等第)”后点击“分析”菜单,选择“百分比”/“行” ? ? ? 5.1.4 数据可视化 结论:通过“15-17级等级考试各等第人数综合统计”工作表和“15-17级学生各等第合格与优秀率统计”工作表,可以分别按“年级”,“性别”、“学院”字段动态的显示等级考试通过的精确人数及通过的百分比情况进行统计。观察缺考情况,从而进一步考量各学院的及格情况。以及各组数据的环比变化情况。其中:健身指导与管理专业缺考率较大,优秀率为0,合格率仅占25%,这个专业无论从教学上还是学生管理上都应该加强,并要及时招开座谈会与系主管老师取得联系,综合管理加强。卫生技术与护理学院和国际商务与管理学院人数最多,虽然
文档评论(0)