- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
哈佛博士吕晓辉:LexisNexis 金融大数
据实践
吕晓辉,律商联讯风险信息公司中国区市场总监,数据和分析产品开发专家。
现专注于为律商联讯风险信息公司开拓中国市场。曾为律商联讯开发推广了一
系列针对美国金融行业的大数据产品:消费者询价活力评分、车险保单实时预
填服务、保费偿付历史共享平台、个人信用记录查询优化等等,取得显著的市
场效果。在加盟律商联讯之前,曾就职于分析咨询公司 Optimal Decisions
Group ,专业信息提供商ChoicePoint。于南京大学获得学士学位;于哈佛大
学获得硕士和博士学位。
嘉宾介绍(吕晓辉):大家好!我是律商联讯的吕晓辉。非常荣幸今天有机会
和大家分享律商联讯对大数据的一点心得。感谢大家抽空来参与。感谢张华平
教授的邀请,和张涵诚的主持。
分享嘉宾(吕晓辉):
今天的想给大家分享一点干货:律商在美国运营大数据的一点心得。
首先,我想介绍一下律商联讯和我们的大数据业务模式;
其次,分享几个实际案例;
再次,介绍一下我们专有的大数据核心算法;
最后,看大家的兴趣,可以深入讲一讲技术体系的细节。
分享嘉宾(吕晓辉):
律商联讯是励德爱思唯尔集团旗下专业经营大数据在银行、保险、政府等风险
行业的应用的全资子公司。律商联讯是励德爱思唯尔集团旗下专业经营大数据
在银行、保险、政府等风险行业的应用的全资子公司。
分享嘉宾(吕晓辉):
我们在美国的大数据业务的商务模式如上页幻灯片所示。海量数据资源、大数
据技术、大数据关联和分析、行业专门经验和产品有机集合成为以客户为中心
的行业解决方案。我们的业务专注与 B2B 业务模式。
分享嘉宾(吕晓辉):
这是我们在美国市场收集的部分数据介绍。
对于如何应对大数据的挑战,我们有一点自己的观点,容我简述如下:
分享嘉宾 (吕晓辉):
大数据关联技术,在我们看来,是将原油提炼成为各种石化产品的核心技术。
分享嘉宾(吕晓辉):上面是律商联讯的专有大数据技术 HPCC 的一点简介。
我就不一一复述。需要强调一点,我公司的基础大数据技术平台是完全开源
的。欢迎大家访问 下载。
嘉宾介绍(吕晓辉):我们技术的最大优势在于功能完整﹑高性能﹑低成本﹑
久经实时生产应用的考验。
分享嘉宾(吕晓辉):
刚才提到的大数据关联技术,在此我略作简述。下面还会细讲。
大数据关联技术的核心之一是个体解析,即把和某个个体相关的所有记录都完
整、准确地聚类到一起。
只有做到准确,才能不把其它个体的信息错误地归入这个个体的记录集群。
只有做到全面,才能不遗漏和这个个体相关的记录。
准确、全面是进一步大数据应用的基础,一定要打好。
分享嘉宾(吕晓辉):呵呵,最后一页公司宣传,用以佐证下面的应用案例的
可靠性。
嘉宾(吕晓辉):第一个案例是一个关于电商的例子。其中大数据的应用在于
反欺诈。在坚实的数据基础上,反欺诈是一个相对普适的应用。
对于这些案例的细节,我就不复述了。欢迎大家随时打断我来提问。
嘉宾(吕晓辉):这第二个案例是一个我公司的姊妹公司爱思唯尔的实际应
用。展示了 HPCC 技术的海量数据处理能力。
第二个案例和亚马逊差不多,只不过是一个更加专门的场景。效能也更好一
点。
这第三个案例是关于物联网的例子。个人觉得是咱国家机场迫切需要的应用。
嘉宾(吕晓辉):第四个案例是关于网络安全漏洞的排查。再次展示了海量数
据处理能力和网络行为模式的识别能力。
嘉宾(吕晓辉):第五个案例是我个人的最爱:通过关系网络来识别合谋欺
诈。
合谋欺诈,主要在于观察什么是正常的行为模式;然后再筛选出哪些是不正常
的行为模式,即有可能是合谋欺诈。多个数据点的交叉验证在此也变得尤其重
要。
这个案例的特点在于关系网络的质量,只有在个体解析做到完整、准确时,才
会有效地支持这个应用。
嘉宾(吕晓辉):第六个案例是我公司的核心技术平台:LexID。过对来自一
万多个活数据源的数据的持续整合、关联,我们能够完整掌握美国成年人口的
在社会中留下的数据足迹。
在美国,政府信息公开得到比较彻底的实现。我公司投入了大量的人力物力来
从零散的数据源里收集公共记录数据。另外,许多私有数据源也被我们通过商
务手段合法获得并利用。
相比起网络爬虫或者社交网络数据来说,我们发现,一些“传统”的数据源,
例如婚姻记录、犯罪纪录、房地产买卖记录更加有用。
嘉宾(吕晓辉):最后一个案例,是我公司的前身,美国 ChoicePoint 公司在
2008 年被律商联讯收购后,所经历的技术平台的迁移及其效果。
嘉宾(吕晓辉):
原创力文档


文档评论(0)