数据质量产品功能参考.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据质量产品功能参考

目录 推荐解决方案 3 概述 3 集成工作流 4 IDQ 工作平台(企业用户界面) 4 数据质量指标 6 计分 7 数据标准化 9 用户自定义参考数据词典 9 IDQ 匹配 11 地址验证和数据扩充 13 数据质量流程与实施办法 14 数据所有权与管理 14 数据质量流程与方法 15 项目计划、里程碑与时效性 16 整个数据质量计划的关键里程碑 17 期望的成本节约和投资回报 20 使用数据质量软件的驱动因素 20 成本和效益 20 提高数据质量案例分析 21 背景 21 根据改善的项目回报计算 ROI 21 根据数据清理降低的成本计算 ROI 22 总结 23 推荐解决方案 概述 Informatica Data Quality (IDQ) 是一种主要针对企业的信息质量平台,可帮助数据所有者设计、管理、部署和控制企业级数据质量解决方案。通过 IDQ,企业可重复使用信息质量业务规则,在共享的开放式资料库中存储并部署相同规则。IDQ 还侧重于简化令大型企业头疼的各种数据清理问题,如客户、产品、供应商和原材料,而不仅仅是名称和地址。 对许多企业而言,当面对数据集成/应用程序集成项目时,数据质量是他们次要考虑的问题。但是,管理数据质量之一难题将迅速成为其主要考虑的问题,因为如果在迁移过程中遗留下来的数据质量问题不可理解,将会产生大量重复映射的工作,并需要重新跟踪工作以发现问题。由于没有足够的时间来修复这些问题,因此大部分应用程序项目被以各种方式大打折扣 - 功能减少、预算超支或交货延期。 Informatica 软件解决方案设计旨在最大程度地提高部署和互操作的灵活性。许多企业内的离散功能对数据质量的要求很高,如 ETL/数据集成、商务智能、实时应用、产品/物料协调等。在某些情况下,数据质量解决方案甚至起到至关重要的作用。但是,在诸如[客户]方的项目中,要想高效便捷地使用数据,就必须在 ETL 和数据质量流程之间实现紧密集成。 Informatica 数据集成平台可从任何系统访问数据,就数据问题和关系发现信息,运行各种清理流程,最后集成并传送至目标系统。整个流程集成为一体化的工作流,它能将优质数据传送到[客户]方的新数据仓库 (DW) 环境中,从而改善并维护正在进行的业务流程。 图 1 数据集成平台 以下是一个显示 PowerCenter 和 Informatica Data Quality (IDQ) 之间集成的逻辑序列。IDQ 只是一种从 PowerCenter 映射中调用的自定义转换对象: 图2 PowerCenter 自定义转换 – IDQ 图示内容是 PowerCenter Designer,该程序在映射中叫做地址验证数据质量计划。但是,从 PowerCenter 中可调用针对任意业务数据的任何数据质量计划。在 Designer 中有一个可与 IDQ 资料库建立连接的 IDQ 转换对象,用户可从中选择所需的 IDQ 计划。选择计划后,所有用户所需的端口将被填充。IDQ 转换对象可重复使用,用户只需将对象拖放至映射中,然后连接端口即可。他们无需了解数据质量计划中有何种预建组件。和其它标准转换对象一样,IDQ 转换对象显示在 Designer 工具栏中。 IDQ 工作平台(企业用户界面) IDQ 工作平台是一种用于制定数据质量规则的前端工具。IDQ 具备即点即到(直接拖放)的用户界面,用户能够快速制定出数据质量计划和项目。IDQ 提供企业领先的方法,发现数据质量问题和 GUI 驱动标准化,清理并强化各项流程,使企业用户能够从计划到实施全程维护流程控制。 图 3:IDQ 工作平台 IDQ 专为企业用户和数据分析师设计。IDQ 内含的所有组件均内嵌了逻辑或运算法则,在配置时采用即点即到或向导设计,方便操作。 从功能上讲,该解决方案能够首先测量其数据质量级别,然后自动清理和整合数据。IDQ 产品分为两个完全不同的阶段:数据分析和发现与数据增强: 数据分析和发现 – 用于确定数据类别,分析数据质量问题,例如准确性、一致性、匹配率和关系等。还能深化个别低质量记录,从而快速确定问题。 数据增强 – 用于清理、分析、标准化和删除重复的数据以及整合和扩充数据。 图 4:IDQ 流程流 制定数据质量指标和规则十分重要,它是进行任何数据项目的首要步骤。Informatica 综合了多项专业服务和技术,确保为每一个项目建立坚实的基础。Informatica 拥有经验丰富的技术人员以及严格的制造环境,我们的产品能够帮助[客户]制定数据质量指标和规则,从而完成成功迁移并满足正在进行中的业务需求。通常,在制定数据质量指标和规则时,所有数据都要接受 Informatica 的数据质量指标的评估。 图 5:数据质量的六项指标 Informatica

文档评论(0)

2017ll + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档