- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
PartIDataMiningFundamentalsChapter1:DataMining:AFirstView
2025/6/4BUPTAIDM2Content1.1WhatisDataMining?Definition1.2WhatcancomputersLearn?1.3IsDataMiningAppropriateforMyProblem?1.4ExpertSystemsorDataMining?1.6WhyNotSimpleSearch?
2025/6/4BUPTAIDM31.1Whatisdatamining:MotivationDataexplosionproblemAutomateddatacollectiontoolsandmaturedatabasetechnologyleadtotremendousamountsofdatastoredindatabases,datawarehousesandotherinformationrepositories.Suchamountofdatabeyondhumanunderstanding.Wearedrowningindata,butstarvingforknowledge!Solution:DatawarehousinganddataminingDatawarehousing:fordatastorageDatamining:forExtractionofinterestingknowledge(rules,regularities,patterns,constraints)fromdatainlargedatabases
1.1DataMiningisaresultofnaturalevolutionofinformationtechnology1960s:Datacollectionanddatabasecreation1970s-early1980s:DatabaseManagementSystemsMid-1980s-present:DatawarehouseDataanalysisandunderstanding(datamining)
DataAnalysis:NewTrendThisisatimethatonemustspeakwithdata.未来属于运算师(SuperCrunchers《超级运算师》,IanAyres,2009):日常决策将变得越来越自动化,人的判断作用将局限于为计算提供数据葡萄酒味道和香味的预测:奥利.阿申费尔特是普林斯顿大学的经济学家,完全不懂葡萄酒的制作,但可以预测波尔多葡萄酒的价格基于天气(炎热、干燥的年份酒会非常好),准确率高于葡萄酒专家本书原计划叫“理论的终结”,后来利用google改书名而不是与出版社编辑讨论,因为发现用此名点击率高63%放贷员曾经收入优厚、职责最大,现在只是呼叫中心的接线员,重复电脑提示的问题,报酬很低
DataAnalysis:NewTrend(cont.)Thisisatimethatonemustspeakwithdata.基因测序和新物种:克雷格.文特尔使用能够分析数据的高速计算机,从给单个生物基因排序,2003年开始给海洋测序,2005年给空气测序。这个过程中发现了数千种以前不知道的细菌和其它生命形式。他对生物学的推进比同辈所有人都大。
在过去,上海通用保修问题分析主要依靠简单的纯手工处理的计算方式,每次只能产生寥寥几篇问题报告。尽管汽车生产量远不如现在大,但这个耗时费力的分析周期却在根本上导致了保修成本居高不下。在非自动操作环境下,从保修索赔出现到找出问题原因平均要花费6~12个月的时间,且在此间往往还需要借助于通用全球的支持,解决问题的整个过程也主要建立在经验分析的基础上。另外,不准确的数据导致上海通用难以准确预测保修成本,从而合理准备下一周期的保修预算,导致大量运营资金被占用、现金流降低。采用SAS的保修分析解决方案后,上海通用的保修分析周期在头6个月里就缩短了70%,有效地降低了保修成本,实现了该系统使用的预期目标。同时,这些显著的改善效果帮助上海通用在短短半年内就收回了保修分析系统所有的软硬件投资,共为公司节省了1,800万人民币的成本。警察地理信息系统
DataMiningDefinitionsTheproce
文档评论(0)