- 1、本文档共14页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Informatica增量抽取图文教程
Informatica 增量抽取图文教程源表T_SOURCETABLE初始有两条测试数据目标表T_TARGETTABLE初始默认清空一、按时间戳抽取首先,我们根据CREATE_DT来进行数据的增量抽取,模拟场景为第一次抽取全部数据,第二次抽取第一次抽取之后新增的数据。MAPPING图如下,主要使用了一个Expression组件:选择Mappings菜单的参数与变量选项设置变量v_pumpdt新建变量$$v_pumpdt, 类型选择变量,数据类型选择 date/time,汇总方式选择MAX。下面的初始值用于第一次全量更新,可以根据实际情况设置,我这设置成01/01/1970 00:00:01。修改SQ组件的过滤方式:可以先用生成SQL按钮自动生成select语句,然后下面增加过滤条件:whereT_SOURCETABLE.CREATE_DT=to_date($$v_pumpdt,mm/dd/yyyy hh24:mi:ss) andT_SOURCETABLE.CREATE_DTto_date($$$SESSSTARTTIME,mm/dd/yyyy hh24:mi:ss)即只过滤出从变量v_pumpdt值到抽取任务执行时间值之间这段时间create的数据。完成后可以用验证按钮验证语句的准确性。这里要注意日期时间类型字段的数据格式,由于服务器设置不同可能格式不同,而如果你取到的数据值和你指定的格式不匹配,在后面执行抽取任务时会报错。我这个测试环境的格式是mm/dd/yyyy hh24:mi:ss修改Expression组件,增加一个表达式,把$$v_pumpdt的默认值置为SESSSTARTTIME的值, 这样下次执行时, 则会从这个时间,即上次session执行时间开始算起, 达到个增量的目的。新增表达式设为date/time型,I、O、V端口这里选择V,设置表达式内容为:SETVARIABLE($$v_pumpdt,SESSSTARTTIME)设计完成后保存Mapping文件,然后打开Workflow设计。新建一个workflow,设定好源表和目标表的数据连接。保存,并执行workflow,可以在monitor中看到任务执行成功Target表中插入了源表中的两条数据,即完成了首次的全量抽取。这时候我们可以在workflow中查看到变量的变化情况:我们可以看到变量v_pumpdt的值变成了我们这次workflow开始执行的时间。在这里说明一下,如果不再执行增量抽取,需要再次全量抽取数据时,只需要在这里执行reset values,即可把变量值初始化回之前设定的01/01/1970 00:00:01。上文中提到的日期格式也可以在这里看到是mm/dd/yyyy hh24:mi:ss格式,如果是其他格式请相应修改SQL中的格式。接下来我们验证增量抽取的执行情况,在源表中新增两条数据,一条是用于抽取的“测试数据3”,创建时间介于第一次抽取时间与第二次抽取时间,另一条是对比数据“测试数据4”,虽然是新增数据,但我们把create_dt设为第一次抽取时间之前。再次运行workflow,查看结果,我们可以看到只有符合条件,即创建时间介于两次抽取之间的测试数据3被正确抽取。验证按时间戳抽取数据正确执行后,即可将workflow设为按计划执行, monitor中进行监控即可。二、比对更新抽取上文介绍了按时间戳字段对数据进行增量抽取,但实际情况我们有些源表中没有有效的时间戳字段,或者例如上文例子中,有个新增数据“测试数据4”无法根据时间戳进行增量抽取,这种时候怎么办呢?我们可以根据数据比对的方式进行增量抽取,还是以刚才的测试数据为例:Mapping图如下,主要用到了一个Lookup组件和一个Update Strategy组件2、创建Lookup组件时会提示你需要Lookup哪个表的数据,这里指定成目标表,我们设定的场景是需要根据源表的ID值去Lookup目标表,如果不存在,增插入,如果ID存在,并且NAME相同,则拒绝插入,如果ID存在但是NAME不同,则update更新。这里是为了演示效果,用了NAME字段,实际项目中,可能会根据modified_dt或者多个字段去进行比对。Lookup组件创建好后会自动加载目标表的字段,这时候我们将SQ组件中的ID和NAME字段拖拽到Lookup组件中,会自动创建ID1和NAME1字段。先将Lookup组件中的ID和NAME拖拽到Update Strategy组件中,再将SQ组件中的全部字段拖拽进Update Strategy组件(此时ID和NAME会自动更名成ID1和NAME1),再从Update Strategy组件拖拽到目标表组件,即Update Strategy组件中的ID1、NAME1和目标表中的ID、N
您可能关注的文档
- 2016年春中国石油大学(北京)人力资源开发与管理(含实践)第二次在线作业(标准答案).doc
- 2016年注册监理进度重点整理.docx
- 2016年江苏单招地理模拟试题区域水土流失及其治理.docx
- 2016年海南单招地理模拟试题区域水土流失及其治理.docx
- 2016年钻井20972队工作全年总结.doc
- 2016年高考全国卷理综化学命题特点简析.docx
- 2016最新西南大学网络教育《马克思主义基本原理》大作业A.doc
- 2016朝阳高三一模作文标杆文与讲评.docx
- 2016江门公职人员100分2.doc
- 2016浙大远程工程概预算在线作业正确答案.doc
- 物联网云平台应用开发 课件 项目4-3、通过Python实现HTTP协议.pptx
- 单片机应用技术教程(基于Keil与Proteus)(微课版)实训项目17 交通信号灯.docx
- 物联网云平台应用开发 课件 项目2-3、认识Python.pptx
- 物联网云平台应用开发 课件 项目5-5、M5311模块硬件平台搭建.pptx
- 短视频拍摄与剪辑课件 项目三 准备商品短视频拍摄设备.pptx
- 物联网云平台应用开发 课件 项目3-1、认识物模型.pptx
- 《电力机车控制线路的调试与维护》 课件 主电路0.ppt
- 单片机应用技术教程(基于Keil与Proteus)(微课版)实训项目 LCD12864液晶显示.docx
- 药理学 课件 4-1-1镇静催眠药.pptx
- 《电力机车控制线路的调试与维护》 课件 主电路1,2.ppt
最近下载
- 一种固定床加氢催化剂的制备方法及其应用.pdf VIP
- 2025年福建省教师招聘考试小学语文历年真题 .pdf VIP
- (五个方面)2025年作风建设学习教育查摆问题清单+2025年作风建设学习教育专项整治查摆问题清单及整改措施.docx VIP
- 四个能力自查评估表.doc VIP
- JJG 74-2005_工业过程测量记录仪.pdf
- 物理简单机械和功复习苏科九年级上.pptx VIP
- 精品解析:2024年湖南省中考物理真题(原卷版).docx VIP
- 高考化学第一轮全程复习课件.pptx VIP
- 专题2.18 二次根式加减混合运算50题(专项练习)-2022-2023学年八年级数学上册基础知识专项讲练(北师大版).docx VIP
- 2025年20个需求分析的技巧.pdf VIP
文档评论(0)