Informatica智能数据湖介绍.PDF

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
产品单页 Informatica 智能数据湖 以合作的方式查找、准备和治理数据来进行分析。 优势 毫无疑问,数据已成为 21 世纪竞争制胜的法宝。组织正寻求利用新数据处理平台(如 • 为您的分析项目找到合适的 )来获取之前无法获得(并非不可想象)的洞察。 和数据 Apache Hadoop Apache Hadoop 数据 湖概念的出现,让组织可以将所有数据集中在一起,方便用户随时访问,进行各种分析。 • 了解您是否可以信任您的数据 企业收集客户和市场数据,进而改善客户体验,推动业务发展。金融机构保存和监控交易数 据及其他相关信号,以便扩充欺诈检测技术,紧跟全球法规监管变化的步伐,并极大提升客 • 快速准备和共享所需的数据 户对其服务安全的信任。医疗机构保存电子医疗记录数据和索赔数据,以便提供更加个性化 的医疗保健服务。大数据技术为数据的利用提供了无穷机遇。 利用数据资产建议通过项目工作区与其他分析师进行合作。 负担还是恩惠? 摄入 系统中的海量数据使 不堪重负。业务分析师期待 中的优质数据,而 则承受着巨大 Hadoop IT Hadoop IT 的负担,需要通过手动耗时的流程将原始数据整理为适用的数据资产。如果没有可扩展、可重复的智能数据整 理机制,数据湖就没有机会降低风险。数据湖本身仅仅是实现目标的途径。如果无法从中获得价值,数据湖将 变成沼泽之地。解决数据沼泽危机的关键是由通用元数据服务驱动的数据智能,这些服务收集、索引、剖析、 发现和推断有关数据集的信息。 通过从数据湖内数据质量和状态的分类以及应用至这些数据的合作数据准备能力获得附加价值,业务洞察将从 静止的数据湖中产生。 智能数据湖可以将原始大数据系统地转换为专门适用于各种数据用户的数据集。数据科学家和分析师可通过语 义和维度搜索快速查找所需的数据。他们可以查看数据概况、沿袭和其他关系,以了解是否可以信任这些数 据,以及是否适用于他们的分析项目。 建议和方案 数据分析师团队可以轻松地相互合作,并在项目工作区共享结果。当他们将数据集添加到其项目工作区时,机 器学习算法在后台工作,为他们推荐可能有兴趣使用的其他数据集。项目工作区内的数据集可以随时在智能数 据湖的数据准备工具中打开,此工具方便易用,与 Excel 类似。 数据准备在数据智能(例如推荐联接键来混合数据集)的引导下进行。数据准备工具中的每一项操作都记录在 方案中,当实施大数据洞察时,这些方案会自动生成可部署到生产中的数据管道。通过这样的实施过程,组织 可以快速且可重复地将大数据转换为提供可持续业务价值的可靠信息资产。 轻松准备数据集进行分析,并利用方案自动执行数据转换步骤。 关键功能 智能搜索 据集时推荐的联接键。请参阅表级和列级描述统计概述,包 数据科学家和分析师可以利用智能语义搜索和基于推断的结 括价值分布以及数字和日期分布。所有步骤均记录在可用于 果快速找到湖中以及其他企业系统中的数据。数据资产可基 自动生成数据流的方案中,可以重复调度这些数据流以实施 于使用系统属性和自定义分类的动态维度进行筛选。 分析洞察。 360 度全方位数据探索 项目合作

文档评论(0)

***** + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档