美国知名征信所equifax正利用大数据.pdf

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
 美国知名征信所 Equifax 正利用大数据,结合全球的 8000 亿条企业和 消费者记录,开发新的分析产品。大数据挖掘前景不言而喻。   作为美国三大征信所之一,Equifax 公司存储着所有美国成年人以及 另外 16 个国家公民的财务数据,其中包括全球 5 亿个消费者和 8100 万家 企业。这些信息可谓是五花八门:哪些人在共享同一电话号码或地址、牙 齿治疗贷款的申请、杂志订阅、租赁历史记录、房地产资产、投资理财、 购买零售商品、纳税申报单类型、婚姻状况、就业状况、水电费缴付、有 线电视账户、犯罪记录、债务收入比、地址更改、机动车档案、邮政信箱、 推断某人能否支付账单、预测某人的支付意向,与过去和潜在的欺诈犯罪 有无关系等。   这些看起来杂乱无章的海量信息,经过交叉分析和索引处理后,变成 26 PB 的数据。这个数字已经超过了美国联邦调查局的调查数据仓库(据说 是联邦调查局最庞大的数据存储库)的 10 亿份不重复文档。难怪 Equifax CIO Dave Webb 说:“我们对每个人的了解远远超乎他们自己的想象。”   Webb 的话暗示了数据信息的力量,他主张利用Equifax 存储的海量 数据开发利润更丰厚的产品和服务。   Equifax 在过去几年中,相继推出了大批基于大数据的新产品,这些 产品旨在实现两个目标:为 4.6 万家企业客户降低风险,以及促进营销。   用创新赚钱   目前,三大征信所中其他两家,益百利 (Experian)和美国环联 (TransUnion),也在向数据分析转型。三者在竞争中不断推出以大量消费 者信息为卖点的新产品,并宣称自己的数据更广泛、独特。Webb 说: “这 是对手快速跟随的行业,速度和创新是两大决定性的竞争优势。”   2010 年,Webb 从硅谷银行金融集团转投 Equifax。Equifax 给他的任 务是,运用他在运营和 IT 方面的背景,结合金融行业的专长,为 Equifax 发掘新的收入来源。 “刚来的时候,让我吃惊的是,公司很少在数据挖掘 方面发现机会。”Webb对此既兴奋又疑惑。   此后,Equifax 接连推出了 69 个新产品,涉及风险管理、身份验证、 欺诈检测、决策分析和市场营销等领域。   Equifax 综合数据解决方案部门高级副总裁 David Brooks 表示,其中 一款新产品可以帮助企业应用分析技术避免不良客户。据了解,Equifax 的开发人员在这款产品中结合消费者个人信用评分和水电费支付历史记 录而建立新的分析模型。分析结果将帮银行决定,是否值得花时间去争取 那个信用卡支付曾到期未付的客户。   Equifax 还有一款新产品可以用来实时监测信用报告查询的系统,以 及时发现犯罪苗头。Equifax 综合数据解决方案部门副总裁 Keith Manthey 说: “骗子发现有效的行骗手段后,就会迅速共享和使用。该系 统可以对查询速度及其他因素进行评分来判断这项申请是否为骗子所 为。”   打破 IT 传统   Webb 一直在加大力度开发 Equifax 的数据分析和协作功能,他带领 1000 人规模的 IT 小组对大数据进行了大胆研究: “如果数据的使用寿命 是 2 至 15 年,我们必须充分利用这段时间,而从现在 IT 小组取得的成绩 来看,Equifax 无疑已经通过技术创新获得了市场竞争优势。”   2011年,Equifax 收购了一家商业智能工具公司和工作流软件开发商。 事实上,在过去的 5 年中,Equifax 共斥资 17 亿美元收购了多家数据收 集和技术公司。这与 Equifax 在成立之初 50 年,一直采用纸张分类账的 做法大相迳庭。   对海量数据的分析挖掘工作需要付出大量的 IT 成本。以往,拥有大 量数据的公司需要建立大型数据仓库,并在大规模并行处理系统上运行。 Brooks 表示,建立大型数据仓库所需硬件成本太高,另外关系型数据库 的架构也阻碍了对非结构化数据的查询。因此,Equifax 存储和检索数据 的方式一反传统,它并没有将这项工作视做处理查询,而是将它视做交付 内容,将数据分布在低成本服务器集群上,由 IT 部门开发专有的分布式 检索技术来查找信息。   Brooks 说: “由于我们对数据量、交易查询量和响应时间的要求都 很高,因此,我们一直小心谨慎,以免盲目跟随行业标准的做法。业内的 传统做法需要建设庞大而复杂的基础设施,但如果换个角度考虑,其实这 些基础设施建设就变得没有必要。”   目前,Equifax 的数据专家要花时间对从公共和私人来源整合而来的 数据进行重复数据

文档评论(0)

152****7770 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档