基于Spark的交互式数据探索与建模系统.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
;;大数据分析需要掌握这么多装备…;为什么不能有这样的分析工具?;技术选型:Spark;Spark2.0的性能;DI:交互式数据探索框架;DI概览;数据转换;;文本分析;典型算子:特征词提取;信息熵定义;典型算子:词语语义距离分析Word2Vec;探索分析;典型算子1:多维分组统计;;;典型算子2:特征降维(列相关);;典型算子3:离散自相关矩阵分析;应用:保险欺诈合谋分析;合谋关系分析可视化;车辆自相关分析;典型算子4:离散互相关矩阵分析;应用:从报案地点看合作欺诈关系;可疑车辆可视化;离散矩阵分析;典型算子5: 频繁项;数据建模;;数据可视化;无级投影的数据可视化;医疗数据(真实数据);可视化示例;总结;开发状态和下一步计划

文档评论(0)

智慧IT + 关注
实名认证
内容提供者

微软售前技术专家持证人

生命在于奋斗,技术在于分享!

领域认证该用户于2023年09月10日上传了微软售前技术专家

1亿VIP精品文档

相关文档