- 1、本文档共24页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
机器学习
可视化分析
复旦大学 赵卫东 博士
wdzhao@fudan.edu.cn
章节结构
• 可视化分析
– 可视化分析的作用
– 可视化分析方法
– 可视化分析常用工具
– 常见的可视化图表
– 可视化分析面临的挑战
可视化分析
• 可视化分析是一种数据分析方法,利用人类的形象思维将数据关联,并映
射为形象的图表。人脑对于视觉信息的处理要比文本信息容易得多,所以
可视化图表能够使用户更好地理解信息,可视化分析凭借其直观清晰,能
够提供新洞察和发现机会的特点活跃在诸多科学领域
可视化分析的作用
议程
• 在数据分析中,通过绘制图表更容易找到数据中的模式。传统的数据分析
方法存在一些局限性,需要借助于分析师丰富的分析经验。可视化分析方
法将数据以图像的方式展现,提供友好的交互,还可以提供额外的记忆帮
助,对于将要分析的问题,无需事先假设或猜想,可以自动从数据中挖掘
出更多的隐含信息
• 在机器学习领域,缺失数据、过度训练、过度调优等都会影响模型的建立
,可视化分析可以帮助解决其中一些问题
• 可视化分析在机器学习的数据预处理、模型选择、参数调优等阶段也同样
发挥重要作用。在数据建模的过程中,容易辨别出数据的分布、异常、参
数取值对模型性能的影响等
可视化分析的作用
议程
• 在分析结果展示时,通过建立可视化仪表板,组合多幅可视化图表,从不
同的角度来描述信息,全方位展示分析结论
• 除了辅助数据分析之外,可视化分析为看似冰冷的数据带来更多趣味性,
直观清晰的表达拥有更多的受众。在信息传播领域,可视化结果的独特风
格(颜色、线条、轴线、尺寸等)不仅将有用的信息展示出来,更像是种
精美的艺术品,让数据展示也变得更加富有情感
可视化分析方法
议程
• 为了获得易于理解的可视化结果,人机交互很重要。可视化分析的常用方
法大致可以划分为三个层次:领域方法、基础方法以及方法论基础
• 领城方法领域方法是根据数据的来源领域以及数据的性质进行可视化,包
括地理信息可视化、空间数据可视化、文本数据可视化、跨媒体数据可视
化、实时数据可视化等
• 可视化基础方法基础方法包括统计图表、视觉隐喻。常见的统计图表有柱
状图、折线图、饼图、箱图、散点图、韦恩图、气泡图、雷达图、热地图
、等值线等,不同的统计图表有各自的适用场合
• 可视化分析的方法论基础是视觉编码,视觉编码是指受众对于接收到的视
觉刺激进行编码,所以视觉编码的关键在于使用符合目标用户人群视觉感
知习惯的表达方法,鉴于视觉感知习惯往往与一个人的知识、经验、心理
等多种特异性的因素相关,而且视觉感知是一种视觉信息直接映射与信息
提取、转换、存储、处理、理解等后续活动结合而成的过程
可视化分析常用工具
议程
• Excel
• Tableau
• Raw
• Chart.js
• Processing
• Wordle
• Orange
• Facets
• Python、R语言库:
– matplotlib、Seaborn、Pyecharts、ggplosts
常见可视化图表
议程
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文
plt.rcParams['axes.unicode_minus']=False #用来正常显示负号
labels = '财经15%', '社会30%', '体育15%','科技10%', '其它30%‘ #初始化参数autopct为显示的百分比样式
sizes = [15, 30, 15, 10, 30]
explode = (0, 0.1, 0, 0,0)#突出第2项
fig1, ax1 = plt.subplots()
pie = ax1.pie(sizes, explode=explode, labels=labels, autopct='%1.1f%%',shadow=False,
startangle=90)
patches =
文档评论(0)