- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
DMETL中的增量抽取初识.pdf
【干货分享】DMETL 中的增量抽取初识
DMETL 实现了增量数据的同步。在源表上进行的增删改操作,可以通过增量数
据抽取,同步到目的表中。在第一次将源表数据全量抽取到目的表中后,可以通
过重复地执行增量数据抽取,将源表上的增删改操作产生的变化数据,无遗漏地
同步到目的表中,从而实现源表和目的表的长期同步。由于丌需要每次都同步全
量数据,当全量数据巨大,而每次变化数据较少时,可以大幅提升数据同步的效
率。
DMETL 中 “增量表读取 “提供对已建立好的数据库数据源中增量表的数据读取
功能,并且可以对数据读取列、数据行、缓存以及并发等选项的设置。
DMETL 支持的增量有 :
1) 触发器增量 :是通过在基表上建立触发器,捕捉基表上发生的增删改操作,
从而产生增量数据。触发器方式可以捕捉到插入和修改的大对象数据。
2) 影子表增量:是在数据源中,建立一张和基表结构相同的影子表。当基表上
发生了增删改操作后,在增量数据集进行刷新操作时,通过比较基表和影子
表的数据,从而获得增量数据。
3) MD5 增量:通过将变化前后的数据进行 MD5 散列处理,然后比对 MD5 的
散列值是否相同来实现。
4) 时间戳增量:通过一条记录修改的时间戳值或生成的时时间戳值来决定是否
迁移。
5) Oracle CDC 增量方式:是“Oracle 变化数据捕捉”(Changed Data
Capture )的简称,利用了 Oracle 内建的存储函数和过程捕捉和发布变化
数据 ,本质是分析日志的方式,获得Oracle 数据库中某张表上的数据变化,
从而实现增量数据的抽取。
6) DMHS 增量:DMHS 是“DM 异构同步”的简称。DMHS 工具通过解析数
据库日志,在丌同的数据库之间实现数据同步。
各种增量方式的比较和使用建议
增量方式 效率 通用性 使用建议
触发器 高 在表上进行增量抽取 一般情况下建议使用
在表或视图上进行增 一般情况下建议使用,但比较列包含大对象
影子表 较高
量抽取 类型时,效率较低
在表或视图上进行增
MD5 低 需要在大对象类型列上进行比较时可使用
量抽取
在表或视图上进行增 需要修改时间戳列,因此需要数据库支持时
时间戳 较高
量抽取 间戳自劢更新,或手工更新时间戳列
DM 数据库中,在表 需要安装 DMHS 工具。当对性能要求较高
DMHS 高
上进行增量抽取 时建议使用
sync 方式丌支持大对象类型列的比较。当
Oracle Oracle 数据库中,在 对实时性要求较高时建议使用 sync 方式 ,
高
CDC 表上进行增量抽取 hotlog 方式可能有延时,但是对数据源的
影响较小
表格 1
使用建议:
是否要同步
源库
update 和 数据量 建议(按优先级排列)
权限
delete操作
1. 如果目的表上有主键或者唯一索引,可以使用全量抽
取,然后在表目的上使用插入更新选项。
小
2. 每次同步
文档评论(0)