如何像专业人士一样挖掘大数据_光环大数据培训精选.pdfVIP

如何像专业人士一样挖掘大数据_光环大数据培训精选.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
光环大数据--大数据培训知名品牌 如何像专业人士一样挖掘大数据_光环大数据培训 光环大数据大数据培训机构,髋关节置换手术需要多长时间? 这对医院来说并不是学术问题。2015 年,医院约有 360 亿美元的无偿保健 费用,其中大部分来自患者未付的账单。 这个问题的一个解决方案是限制与手术相关的成本,但是如何才能达成呢? 答案是机器学习。医院如今利用预测分析学来预测手术的平均时间和潜在问题, 如髋关节手术。 例如,医疗保健购买者的数据显示患者年龄、核心医疗保健提供者和二次诊 断。使用机器学习和预测分析,数据可以估计未来的成本,帮助确定可能在恢复 中出现问题的患者。此举可使医院做出更好的临床决定,降低二次入院率,缩短 患者的住院时间,并提供更好的护理。 各地企业在使用机器学习分析数据的过程中,发现了类似的现实效果。但问 题是效果周期往往短暂。 弗雷斯特研究公司(Forrester Research)的分析师Mike Gaultieri 指出, 机器学习并不像传统的商业情报工作那样,其结果是确定的。他说:“如果你在 寻找一种机器学习模式,可以说‘我会尝试’,但你可能无法成功实现。企业应 光环大数据 光环大数据--大数据培训知名品牌 该明白仅仅因为希望拥有预测股市的模型,并不意味着就会实现愿望。” DXC 技术分析数据实验室是数据科学家的全球研究中心,他们专注于咨询和 寻找实施分析的方法。实验室负责人Rags Raghavendra 表示企业的表现令人沮 丧,因为它们往往承受太多负担。他说:“客户在尝试挖掘其有权访问的各类数 据的意义时往往好高骛远。我们建议着眼于自己可以访问的数据,然后再着手下 一步的行动。” 如果企业尝试但未能从数据中挖掘到有用讯息,首先应该接受失败和重复是 这一过程的一部分。但是,通过更巧妙地使用机器学习,他们可以最大限度地提 高成功几率。以下是使用机器学习的八种方法: 从想要解决的问题开始。直接研究数据,期待立即发现有用讯息是错误的方 法。正确的数据研究方法始于确定正确的性能衡量标准,这种标准将业务成果和 与数据相关的问题联系起来。但是,所选标准应该适当。例如,当DXC 最近与媒 体公司合作,解释订户离开的原因时,最直观的标准是“订阅者基数”。事实证 明,相关标准是每个用户的平均收入(ARPU),这与公司为增加收入而制定的较 大业务目标直接相关。 使机器学习过程产业化。Raghavendra 表示:“大数据分析的整个过程尚未 实现工业化,”其实验室支持包括制造业、电信、汽车、航空、能源、金融服务 和医疗保健在内的各种行业。“很多时候,你一再重复分析或无法扩展分析。”DXC 是工业化机器学习的坚定支持者,这种学习模式简单高效,认为分析中的所有阶 段,即从抽取和清洗数据,构建算法,到将其投入生产并获取有用讯息,应在企 光环大数据 光环大数据--大数据培训知名品牌 业技术上可重复使用和部署。 无需担忧筒仓。筒仓是许多企业进行数据挖掘项目的灾难,因为它们阻止访 问统一的数据池。但是,筒仓并不像有些人认为的那样是巨大的障碍。 Raghavendra 说:“如果你有智能数据和平台战略,就无需那么担忧筒仓。”简言 之,只要不是你选择的所要解决的问题,就不必对此担心。然而,你应该通过整 合不同的数据源来准备解决以后出现的问题。“灵活和模块化的平台允许你在需 要时整合数据,”Raghavendra 补充说道。 思考外部程序。你并非总是拥有所有的信息、人才、分析和智慧。这是一个 关乎生态系统的问题,那些挖掘他们周围事物的能力的人将会获胜。众包数据科 学家、机器学习和外部数据集都具有强大的潜力。 使用数据湖。数据湖就是存储库,不管格式如何,你都可以按原样存储所有 现存的数据。Raghavendra 表示,公司应该把所有数据放在数据湖中,即使起初 不知道如何使用它。但不要一开始就考虑构建数据湖。 带着目

文档评论(0)

tazhiq2 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档