- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* 技术壁垒高:面向高端分析师,培训成本较高。 工具性强:分析结果无法有效指导决策。 未实现闭环分析流程:模型部署成本和周期较长,模型的时效性差。 承载能力小:算法机制和系统硬件环境制约,数据承载能力不能满足企业级数据分析要求 如上面所示,总体来说,国内外数据挖掘技术目前的应用主要存在以下瓶颈: 数据挖掘技术壁垒较高。导致其目标群较小,主要集中在一些高段分析师(尤其统计分析师)。培训成本和人力成本较大。 当前的主流产品工具性太强。目前主流产品都仅仅是一个分析工具(桌面软件或C/S模式),只能由一些分析师使用,并产生一些分析报告。但是,数据挖掘的最大客户群——业务人员,却因为部门间协调成本较大,或技术壁垒等原因很少对其分析结果问津,从而导致数据挖掘的分析结论往往未能最终指导决策,并产生效益和效能。同时,由工具软件产生的结论往往是零零散散的,从而使得数据挖掘的应用,不能在管理上形成系统的方法论,当然也就导致项目没有可持续性。 传统数据挖掘软件数据承载能力较小。由于传统主流数据挖掘软件厂商均为统计软件厂商,而统计软件和统计方法大多只是对一些宏观数据进行分析,所以往往数据承载能力较小,大多只能支持百万条以内数据量的建模,或对原始数据进行抽样处理。但随着数据仓库技术的产生和推广,对数据挖掘软件的数据承载能力要求越来越高。 未能实现真正意义上的闭环分析流程。虽然,传统数据挖掘厂商(如SAS、SPSS)都推崇数据挖掘项目的闭环流程。业务决定分析,分析再指导业务。但是由于其工具性产品的特点,导致其无法实现真正意义上的闭环流程。从而导致模型部署成本和周期较长,同时不能有效地保证模型的时效性。 尽管国内也有部分公司已经研发出数据挖掘产品,但其仅仅是对国外产品功能的简单模仿,缺乏对市场深入分析和创新意识,当然也无法引导国内外数据挖掘市场。 * 确定业务目标 数据的搜集和理解 数据的准备:清洗,整合,转换 模型建立和调整:方法选择,参数选择,模型创建,模型测试和评估,模型调优 模型应用:部署,应用,监控 K-Miner通过吸收、综合6sigma理论、CRISP-DM标准等方法论各自的优势,并通过深入分析BPM、CRM、OA、MIS、ERP等系统设计理念及流程设计思想,在方法论上对CRISP-DM分析流程进行了完善,强化了其闭环流程,在系统内部形成了一套更适合数据挖掘分析流程的闭环分析流程,从而使分析流程更完善、更科学、更便捷。从而实现真正意义上的闭环管理思想,以降低项目实施的沟通成本,缩短模型部署周期,保证项目的可持续进行和发展。 K-Miner闭环流程分为 主题创建(对应于“业务理解”)——〉数据探索、统计图形、统计分析(对应于“数据探索”)——〉数据预处理(对应于“数据转换”)—〉建模(对应于“模型建立”)——〉测试(对应于“模型评估”)——〉应用、决策支持(对应于“模型部署”)——〉主题调整(对“业务理解”进行反馈)7个环节。 确定业务目标 数据的搜集和理解 数据的准备:清洗,整合,转换 模型建立和调整:方法选择,参数设置,模型创建,模型测试和评估,模型调优 模型应用:部署,应用,监控 * * 作为一款数据挖掘工具 K-Miner要以其在分析算法方面的优势,为用户提供最为深入、准确、高效的洞察力; 作为一款分析系统 K-Miner要充分利用B/S模式的优势,最大限度地为用户提供最为便捷的服务; 作为一款决策支持系统 K-Miner要将产品的易用性和分析结果的可读性作为永恒的宗旨。 * * 为解决传统数据挖掘产品面临的问题,K-Miner除了吸收传统数据挖掘产品的优势之外,采用了如下策略对产品进行设计,以弥补传统产品的缺陷: (1)易用性 作为一款数据挖掘软件,K-Miner通过算法建模参数的自适应调节机制,减少人机交互,尽可能地降低产品使用的技术壁垒。 (2)企业级应用 针对企业数据挖掘特点,增加面向企业级应用功能。如支持海量数据挖掘、多用户挖掘,实时打分等功能 (2)架构设计 采用优秀架构设计思想(如SOA、分布式计算),形成独特的神通数据挖掘架构,与企业现有系统进行快速整合。 (3)流程设计 闭环分析流程 K-Miner通过吸收、综合6sigma理论、CRISP-DM标准等方法论各自的优势,并通过深入分析BPM、CRM、OA、MIS、ERP等系统设计理念及流程设计思想,在方法论上对CRISP-DM分析流程进行了完善,强化了其闭环流程,在系统内部形成了一套更适合数据挖掘分析流程的闭环分析流程,从而使分析流程更完善、更科学、更便捷。从而实现真正意义上的闭环管理思想,以降低项目实施的沟通成本,缩短模型部署周期,保证项目的可持续进行和发展。 K-Miner
您可能关注的文档
最近下载
- 山东省泰安市2025届高三四模检测(泰安四模)英语试题及答案.docx VIP
- 2024-2025学年深圳中学初中部七年级入学分班考试数学试卷附答案解析.pdf
- GB50424-2015 油气输送管道穿越工程施工规范.docx VIP
- (2025秋新版)人教版三年级数学上册全册教案.docx
- 采矿工程毕业设计论文-麦地掌煤矿150万吨矿井初步设计.doc VIP
- 德隆煤矿90万吨初步设计.doc VIP
- 2025年山东黄金集团井下技能工人招聘(2000人)考试备考题库及答案解析.docx VIP
- 直肠癌手术编码.pptx VIP
- 2025秋统编版(2024)道德与法治一年级上册教学设计(全册) .pdf
- Unlock2 Unit4 第一篇听力讲解及答案.pptx VIP
文档评论(0)