网站大量收购闲置独家精品文档,联系QQ:2885784924

高教社Tableau数据可视化教学课件2.2.1清洗字段类型错误.pptx

高教社Tableau数据可视化教学课件2.2.1清洗字段类型错误.pptx

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据可视化清洗字段类型错误01数据清洗必要性02“价格”字段清洗03“评价数”字段清洗清洗字段类型错误的必要性在Excel中,由于对单元格并不存在严格的类型限制,有可能出现字段类型错误,例如:将“价格”、“数量”等数值类型的数据以文本类型进行存放。因此,在数据统计分析前需要将这些字段进行相应的转换。下面我们以“手机采集原始数据.xlsx”为例,来对数据源中的字段类型错误进行处理。“价格”字段清洗打开Tableau,连接“Microsoft Excel”数据源,选择“手机采集原始数据.xlsx”文件并打开,如图所示,“价格”字段上方为文本类型“Abc”标识符。当需要求各类型手机的平均价格时,就无法对该字段进行数值统计。“价格”字段清洗Tableau中使用计算字段可以将价格转换成数值类型,在图2-6的“价格”字段名上右击鼠标,在弹出的快捷菜单中选择“重命名”,图如2-7所示,将“价格”重命名为“_价格”。右击 “_价格”字段后弹出快捷菜单如图2-8所示,选择“创建计算字段”,打开计算字段编辑界面,如图2-9所示,在编辑区输入公式:float([_价格]),即可以将字符型转换成数值型。 “价格”字段清洗转换后的结果如图所示,“价格”字段前原来的“Abc”字符串符合变成了数值型“#”符号。“评价数”字段清洗 现在来观察一下“评价数”这个字段,它的转换比较复杂,因为评价数位于两个括号中间,后面有“+”号,而且超过1万的评价数,还使用“1.3万”这样的表示方式。这个复杂的例子需要用到更多的字符串函数。首先,将“评价数”重命名为“_评价数”。接下来,使用字符串函数截取中间的数字部分。处理公式是:REPLACE(mid([_评价数],FIND([_评价数],()+1,FIND([_评价数],))-FIND([_评价数],()-1),+,)“评价数”字段清洗 有了字符串处理公式,我们创建一个“评价_1”的计算字段,在编辑区输入上面的字符串处理公式,如图所示。最后,原始评价字段中的数字部分全部截取成功。“评价数”字段清洗但是,计算字段“_评价1”,仍然是字符串,而且由于评价数高于1万的,显示“xx万”这种样式,所以还需要高于1万的进行判断,转换后再计算,低于1万则直接进行类型转换。这个计算字段需要逻辑函数的参与。因此,在“_评价1”字段上,需要设计下面的输入公式:IF ENDSWITH([评价_1],万) THEN FLOAT(LEFT([评价_1],FIND([评价_1],万)-1))*10000ELSE FLOAT([评价_1])END“评价数”字段清洗根据上面的公式,我们创建计算字段“评价数”,在编辑区输入上面的公式,如图所示。谢谢观看

文档评论(0)

allen734901 + 关注
实名认证
内容提供者

副教授持证人

知识共享

领域认证该用户于2024年11月14日上传了副教授

1亿VIP精品文档

相关文档