ETL数据整合与处理 第4章 字段处理 (1) 优秀教学课件.pptx

ETL数据整合与处理 第4章 字段处理 (1) 优秀教学课件.pptx

  1. 1、本文档共51页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
字段处理;;数据文件中有些字段全是数字,如电话号码字段会被系统当成浮点型处理,有些字段在某个场景里用不上,也有个别字段使用了不恰当或错误的名称。 对于这些问题,都需要对相对应的字段进行改变类型、去除字段和改变名称等字段处理。 为了统计语文、数学和英语3门基础学科的分数,需要对某年级的“2018年4月月考成绩.xls”文件,使用【字段选择操作】组件,选择语文、数学和英语字段,并且把创建时间改为考试时间。;(1) 建立【字段选择】转换工程。 (2) 设置【字段选择】组件参数。 (3) 预览结果数据。;使用Ctrl+N快捷键,创建【字段选择】转换工程。接着创建【Excel输入】组件,设置参数,导入“2018年4月月考成绩.xls”文件,预览数据,如图所示,“序号”“学号”字段出现小数,有“创建时间”而没有“考试时间”。;在【字段选择】转换工程中,单击【核心对象】选项卡,展开【转换】对象,选中【字段选择】组件,并拖曳到右边工作区中。由【Excel输入】组件指向【字段选择】组件,建立节点连接,如图所示。;双击【字段选择】组件,弹出创建【选择/改名值】对话框,如图所示,【字段选择】组件的参数包含组件的基础参数和【选择和修改】【移除】【元数据】3个选项卡参数。 ;在组件的基础参数中,【步骤名称】参数表示字段选择组件的名称,在单个转换工程中,名称必须唯一,采用默认值“字段选择”。 ;在【选择和修改】选项卡中,使用一个【字段】参数表设置字段参数,有关参数的说明如表所示。 ;在【选择和修改】选项卡中,对导入的“2018年4月月考成绩.xls”文件中的字段进行选择和修改,步骤如下。 (1) 确定选择和修改的字段。单击【获取选择的字段】按钮,获取导入文件的所有字段,添加到【字段】表中。;(2) 修改字段名称。“创建时间”字段所在行的【改名成】设置为“考试时间”,如图 4 4所示,需要注意的是,输入流“创建时间”字段名称已经被改名为“考试时间”,该字段的【长度】【精度】参数暂时不进行设置。 ;单击【移除】选项卡,展示【移除的字段】参数表,如图所示。;在【移除的字段】参数表中???置参数,移除不需要的字段。因为只需选择3门基础课程语文、数学和英语的考试分数,所以需要设置参数移除物理、化学和生物3门课程,操作步骤如下。 (1) 添加输入流字段。单击【获取移除的字段】按钮,添加输入流的字段名称到【移除的字段】参数表中。;(2) 确定要移除的字段。在【移除的字段】参数表中,单击字段名称所在的行号数,如图所示。按计算机键盘上【Delete】按钮,或右键单击选中的行,单击快捷菜单的【删除选中的行】选项,删除非移除的字段,保留要移除的字段,输入流中“物理”“化学”“生物”字段将被移除。;单击【元数据】选项卡,展示【需要改变元数据的字段】参数表,如图所示。;在【元数据】参数选项卡中,使用【需要改变元数据的字段】参数表设置字段参数,有关参数的说明如表所示。;设置参数;在【需要改变元数据的字段】参数表中,设置需要改变元数据的字段参数,步骤如下。 (1) 获取源数据字段。单击【获取改变的字段】按钮,添加输入流的字段到【需要改变元数据的字段】表中,如图所示。;(2) 设置字段的参数。有关字段参数按照下表进行设置。;此时完成【字段选择】组件参数的设置,如图所示。;在【字段选择】转换工程中,单击【字段选择】组件,再单击工作区上方的 图标。预览字段选择后的数据,如图所示。;;常量是指在计算机程序运行过程中其值不能改变的量。常量可以是任何的数据类型,例如,圆周率“3.141159”、中国首都“北京”等都可以是常量。 增加常量是指在数据中增加一个字段,并给字段设置一个固定的值。 为了方便统计学生考试的平均分数,需要在某年级的“2018年上学期期末考试成绩.xls”文件中,使用增加常量组件,增加“考试课程数”字段,并设置值为“6”。;(1) 建立【增加常量】转换工程。 (2) 设置【增加常量】组件参数。 (3) 预览结果数据。;使用Ctrl+N快捷键,创建【增加常量】转换工程。接着创建【Excel输入】组件,设置参数,导入“2018年上学期期末考试成绩.xls”文件,预览数据,如图所示,没有“考试课程数”字段。 ;在【增加常量】转换工程中,单击【核心对象】选项卡,展开【转换】对象,在【核心对象】选项卡中,选中【增加常量】组件,并拖曳到右边工作区中。由【Excel输入】组件指向【增加常量】组件,建立节点连接,如图所示。;双击【增加常量】组件,弹出创建【增加常量】对话框,如图所示。;【增加常量】组件参数包含组件的基础参数和【字段】表参数,有关参数如表所示。;在【增加常量】对话框中,因为学生考试课程数都是一样的,所以增加“考试课程数”字段,并设置值为“6”,操作步骤如下。 (1) 确

您可能关注的文档

文档评论(0)

弹弹 + 关注
实名认证
内容提供者

人力资源管理师、教师资格证持证人

该用户很懒,什么也没介绍

版权声明书
用户编号:6152114224000010
领域认证该用户于2024年03月13日上传了人力资源管理师、教师资格证

1亿VIP精品文档

相关文档