- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
第7章大数据与数据可视化
教学目标理解大数据的基本特征与数据思维初步掌握FineBI数据仪表板可视化操作初步掌握Matplotlib数据可视化方法
7.1大数据7.1.1大数据的基本特征与数据思维4V特征:Volume(数据规模)、Velocity(数据流转)、Variety(数据类型)、Value(数据价值)数据思维:数据意识、数据获取与处理、数据分析、数据可视化、数据驱动决策、数据伦理与隐私保护
7.1.2数据可视化的基本概念数据可视化的定义与目的数据可视化是为了让人们理解数据,从而快速找到数据背后隐藏的现实问题,并有针对性地解决问题数据可视化的准备对数据分析的需求和关注点明确数据分析目的确定可视化要表达的内容及如何凸显用户关注的核心指标
7.1.2数据可视化的基本概念常见数据可视化图形:比较类、趋势类、占比类、分布类、关联关系类
7.2FineBI数据仪表板7.2.1数据准备连接数据库创建数据集业务包管理添加Excel数据集
7.2FineBI数据仪表板7.2.2数据分析与图表应用维度和指标内置函数:聚合函数、统计函数、逻辑函数、日期函数属性设置
7.2FineBI数据仪表板7.2.3仪表板布局与其他组件仪表板的整合与复用过滤组件与图表交互其他图文组件:文本组件、图片组件、Web组件、Tab组件
7.2FineBI数据仪表板7.2.4资源迁移导出仪表板数据包上传仪表板数据包
7.3Matplotlib数据可视化7.3.1线条图和散点图plot()函数与scatter()函数常用颜色、线型、描点标记设置坐标轴、标题、网格线等ucr.csv文件中是编码为GBK的24小时不同分组治疗患者尿肌酐含量数据。用Matplotlib绘制用蓝色虚线连接、描点标记为五角星的折线图importpandasaspdimportmatplotlib.pyplotaspltplt.rcParams[font.sans-serif]=[SimHei]plt.rcParams[axes.unicode_minus]=Falseudata=pd.read_csv(./ucr.csv,encoding=gbk)gr=udata.groupcr=udata.ucrplt.title(24小时尿肌酐分组比较)plt.xlabel(UCR)plt.xticks(rotation=45)plt.plot(gr,cr,--*b,label=UCR)plt.legend(loc=upperright)plt.axis(equal)plt.savefig(./ucr.png)#此代码要放在前面plt.show()
7.3Matplotlib数据可视化7.3.2柱状图与直方图柱状图:bar()函数直方图:hist()函数plt.bar(gr,cr,color=#7ecef4,edgecolor=color,label=UCR)importpandasaspdimportmatplotlib.pyplotaspltplt.rcParams[font.sans-serif]=[SimHei]plt.rcParams[axes.unicode_minus]=Falsetdata=pd.read_csv(体检.csv,encoding=gbk)tz=tdata.体重plt.title(某年级学生体重分布)plt.xlabel(体重)plt.ylabel(人数)plt.ylim(0,8)plt.hist(tz,5)plt.axis(equal)plt.show()
7.3Matplotlib数据可视化7.3.3饼图pie()函数常用参数:explode、labels、colors等importpandasaspdimportmatplotlib.pyplotaspltplt.rcParams[font.sans-serif]=[SimHei]CHN=pd.read_csv(gold.csv,encoding=gbk)gold=CHN.金牌xm=CHN.类别plt.title(第32届夏季奥运会中国队八项比赛金牌占比)explodes=[0]*8#相当于explodes=[0,0,0,0,0,0,0,0],预设都不突出显示explodes[3]=0.2#explodes[3]是第4个,即乒乓球项目plt.pie(gold,labels=xm, #设置数据标签为xmautopct=%.1f%%, #设置扇形里面的文本,数字自动归一化explode=
文档评论(0)