网站大量收购闲置独家精品文档,联系QQ:2885784924

数据可视化|用散点图进行数据分析.pdfVIP

数据可视化|用散点图进行数据分析.pdf

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据可视化 |⽤散点图进⾏数据分析 01 散点图的⽤途有很多,我认为它的核⼼价值,在于应⽤ 关思维,发现变量之间的关系。 散点图就像⼀扇窗,打开它,并仔细观察,能让我们看见更多有价值的信息。 ⽐如说,假设表格中有 10000 个客户年龄和消费⾦额的数据: 我们可以计算每⼀个年龄对应的⼈均消费⾦额,⽐如说,所有 20 岁客户的平均消费⾦额约为 1383.69 元,然后我们可 以画出⼀张散点图: 从图中可以看出,客户的年龄与⼈均消费⾦额有很强的 关性,其中应⽤了线性回归算法,得到⼀条拟合的直线,并⽤ 公式表⽰出来, 接近于 1 ,代表算法拟合的效果很好。 02 接下来,我们看看具体实现的步骤。 # 导⼊所需的库 importnumpy asnp importpandas aspd importmatplotlib asmpl importmatplotlib.pyplot asplt fromsklearn.linear_ model importLinearRegression fromsklearn.prepro essing importPolynomialFeatures fromsklearn.pipeline importPipeline # 正常显⽰中⽂标签 mpl.r Params[ font.sans-serif] = [ SimHei] # ⾃动适应布局 mpl.r Params.update({ figure.autolayout: True}) # 正常显⽰负号 mpl.r Params[ axes.uni ode_ minus] = False # 禁⽤科学计数法 pd.set_option( display.float_format, lambdax : %.2f% x) # 定义颜⾊,主⾊:蓝⾊,辅助⾊:灰⾊,互补⾊:橙⾊ = { 蓝⾊: #00589F, 深蓝⾊: #003867, 浅蓝⾊: #5D9BCF, 灰⾊: #999999, 深灰⾊: #666666, 浅灰⾊: #CCCCCC, 橙⾊: #F68F00, 深橙⾊: #A05D00, 浅橙⾊: #FBC171} 其次,从 Ex el ⽂件中读取数据,并调⽤ sklearn 中的算法,得到拟合的直线和评分结果。 # 数据源路径 filepath= ./data/客户年龄和消费⾦额.xlsx # 读取 Ex el⽂件 df = pd.read_ex el(filepath, index_ ol= 客户编号) # 定义画图⽤的数据:年龄和⼈均消费⾦额 df_group = df.groupby( 年龄).mean x = np.array(df_group.index).reshape( -1, 1) y = np.array(df_group.values) # ⽤管道的⽅式调⽤算法,以便把线性回归扩展为多项式回归 poly_ reg = Pipeline([ ( ploy, PolynomialFeatures(degree= 1)), ( lin_ reg, LinearRegression) ]) # 拟合 poly_ reg.fit(x, y) # 斜率 oef = poly_ reg.steps[ 1][ 1]. oef_ # 截距 inter ept = poly_ reg.steps[ 1][ 1].inter ept_ # 评分 s ore = poly_ reg.s ore(x, y) # 使⽤ 「⾯向对象」的⽅法画图,定义图⽚的⼤⼩ # 使⽤ 「⾯向对象」的⽅法画图,定义图⽚的⼤⼩ fig, ax = plt.subplots(figsize=( 8, 6)) # 设置标题 ax.set_title( n客户每年长⼀岁,⼈均消费⾦额增加+ %.2f% oef[ 0][ 1] + 元n, lo = left, size= 26, olor= [ 深灰⾊]) # 画⽓泡图 ax.s atter(x, y, olor= [ 蓝⾊], marker= ., s= 100, zorder= 1) # # 绘制预测线 y2 = poly_ reg.predi t(x) ax.plot(x, y2, -, = [ 橙⾊], zorder= 2) # 隐藏边框 ax.spines[ top].set_visible( False) ax.spines[ right].set_visible( Fa

文档评论(0)

139****2118 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档