- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
光环大数据--大数据培训知名品牌
如何像专业人士一样挖掘大数据_光环大数据培训
光环大数据大数据培训机构,髋关节置换手术需要多长时间?
这对医院来说并不是学术问题。2015 年,医院约有 360 亿美元的无偿保健
费用,其中大部分来自患者未付的账单。
这个问题的一个解决方案是限制与手术相关的成本,但是如何才能达成呢?
答案是机器学习。医院如今利用预测分析学来预测手术的平均时间和潜在问题,
如髋关节手术。
例如,医疗保健购买者的数据显示患者年龄、核心医疗保健提供者和二次诊
断。使用机器学习和预测分析,数据可以估计未来的成本,帮助确定可能在恢复
中出现问题的患者。此举可使医院做出更好的临床决定,降低二次入院率,缩短
患者的住院时间,并提供更好的护理。
各地企业在使用机器学习分析数据的过程中,发现了类似的现实效果。但问
题是效果周期往往短暂。
弗雷斯特研究公司(Forrester Research)的分析师Mike Gaultieri 指出,
机器学习并不像传统的商业情报工作那样,其结果是确定的。他说:“如果你在
寻找一种机器学习模式,可以说‘我会尝试’,但你可能无法成功实现。企业应
光环大数据
光环大数据--大数据培训知名品牌
该明白仅仅因为希望拥有预测股市的模型,并不意味着就会实现愿望。”
DXC 技术分析数据实验室是数据科学家的全球研究中心,他们专注于咨询和
寻找实施分析的方法。实验室负责人Rags Raghavendra 表示企业的表现令人沮
丧,因为它们往往承受太多负担。他说:“客户在尝试挖掘其有权访问的各类数
据的意义时往往好高骛远。我们建议着眼于自己可以访问的数据,然后再着手下
一步的行动。”
如果企业尝试但未能从数据中挖掘到有用讯息,首先应该接受失败和重复是
这一过程的一部分。但是,通过更巧妙地使用机器学习,他们可以最大限度地提
高成功几率。以下是使用机器学习的八种方法:
从想要解决的问题开始。直接研究数据,期待立即发现有用讯息是错误的方
法。正确的数据研究方法始于确定正确的性能衡量标准,这种标准将业务成果和
与数据相关的问题联系起来。但是,所选标准应该适当。例如,当DXC 最近与媒
体公司合作,解释订户离开的原因时,最直观的标准是“订阅者基数”。事实证
明,相关标准是每个用户的平均收入(ARPU),这与公司为增加收入而制定的较
大业务目标直接相关。
使机器学习过程产业化。Raghavendra 表示:“大数据分析的整个过程尚未
实现工业化,”其实验室支持包括制造业、电信、汽车、航空、能源、金融服务
和医疗保健在内的各种行业。“很多时候,你一再重复分析或无法扩展分析。”DXC
是工业化机器学习的坚定支持者,这种学习模式简单高效,认为分析中的所有阶
段,即从抽取和清洗数据,构建算法,到将其投入生产并获取有用讯息,应在企
光环大数据
光环大数据--大数据培训知名品牌
业技术上可重复使用和部署。
无需担忧筒仓。筒仓是许多企业进行数据挖掘项目的灾难,因为它们阻止访
问统一的数据池。但是,筒仓并不像有些人认为的那样是巨大的障碍。
Raghavendra 说:“如果你有智能数据和平台战略,就无需那么担忧筒仓。”简言
之,只要不是你选择的所要解决的问题,就不必对此担心。然而,你应该通过整
合不同的数据源来准备解决以后出现的问题。“灵活和模块化的平台允许你在需
要时整合数据,”Raghavendra 补充说道。
思考外部程序。你并非总是拥有所有的信息、人才、分析和智慧。这是一个
关乎生态系统的问题,那些挖掘他们周围事物的能力的人将会获胜。众包数据科
学家、机器学习和外部数据集都具有强大的潜力。
使用数据湖。数据湖就是存储库,不管格式如何,你都可以按原样存储所有
现存的数据。Raghavendra 表示,公司应该把所有数据放在数据湖中,即使起初
不知道如何使用它。但不要一开始就考虑构建数据湖。
带着目
文档评论(0)