打破数据挖掘的5个神话.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE 1 PAGE 1 打破数据挖掘的5个神话  数据挖掘是一种强大的分析工具,可以使企业管理人员从描述顾客历史行为开始进一步达到预估顾客将来行为。它可以找出能解释顾客行为的规律。这些数据可以用来增加收入、降低费用、找出商业机会,以增加新的竞争优势。   会有关于数据挖掘的神话产生的部分原因是人们对它没有一个清楚的概念。数据挖掘的本质是一套复杂的数学方法,用来在具体的数据中找出并解释以前未知的规律。数据挖掘解决的是不同类型的问题。它可以用来预估将来的事件,例如在进行市场推广后的下一个月份的销售额。   很多成功的公司已经意识到,围围着数据挖掘而衍生的神话并非事实。有远见的企业不仅不会成为这些神话的受害者,而且他们会通过使用数据挖掘来解决复杂的企业问题并达到赢利,因此获取了巨大的竞争优势。由此打破了有关数据挖掘的5个神话。   神话一:数据挖掘供应立时可见的预估   数据挖掘既不是占卜用的水晶球,也不是一按按钮答案就会魔术般跑出来的技术。它是一个多步骤过程,包括明确企业问题、研究并整理数据、开发模型、应用获取的学问。一般状况下,各企业都用大部分时间来对数据进行预处理和整理,以保证数据无冗余、无瑕疵、连贯全都及合理组合,以供应牢靠的商业情报。数据挖掘的一切都是围绕数据来进行的,成功的数据挖掘需要精确反映企业运营的数据。   各企业必需了解数据挖掘的优势所在,即处理本质上可预估或可描述的详细企业问题。这些问题包括:客户细分、预估顾客购买倾向、查找欺诈、渠道最优化。   神话二:数据挖掘还不适用于商业应用   数据挖掘是一个可行的技术,其商业效果得到了高度评价。关于不适用于商业应用神话的产生归因于那些需要解释他们为什么还没有使用数据挖掘的人,且围围着两个相关的陈述。第一个是“超大型数据库不能被有效地进行挖掘”。第二个是“数据挖掘在数据仓库引擎中不能进行。”   让我们同时解决这两个陈述的问题。因为现在的数据库特别大,所以很多企业均担忧数据挖掘项目所需的额外IT基础设备会增加巨大的成本,而且针对某一项目的数据处理要花过分长的时间。但是目前有些数据库使用平行技术,它可以在数据库内进行挖掘。通过在数据库内进行挖掘,各企业可以不移动数据,利用平行处理,将数据冗余降为最低,避免因建立及维护一套全新的、数据挖掘专用的冗余数据库所带来的成本费用。通过平行处理进行的数据库内挖掘即是可行的数据挖掘技术。   神话三:数据挖掘需要单独的、专用的数据库   数据挖掘供应商一般会宣称,你需要一个昂贵的、专用的数据库、数据集市或分析服务器用于挖掘数据,因为需要将数据拉入一个专属格式以进行高效数据处理。这些数据集市不仅购买及维护的费用昂贵,它们还要求每一个单独的数据挖掘项目都进行数据抽取,这是一个昂贵并费时的过程。   数据库技术的发展使得数据挖掘可以不在单独的数据集市中进行。实际上,有效的数据挖掘需要建立一个企业级数据仓库,其全部成本比采用单独的数据集市的成本要低得多。   现在我们来分析一下其中的原因。当在整个企业范围内采用数据挖掘项目时,使用数据挖掘模型的用户持续增加,同时使用大型数据基础设备的需求也在增加。一个尖端的企业级数据仓库不仅高效地储存了全部企业数据,省去了大部分其他数据集市或数据库,它还为数据挖掘项目建立了一个抱负的基础。此基础是一个单一的企业范围内的数据存储库,它供应了前后全都的最新的顾客状况。通过将数据挖掘延伸整合到数据仓库,企业还可以在另外两个方面降低成本。首先,无须为数据挖掘购买并进行维护额外的专用硬件设备;其次,因采用数据挖掘技术,企业可将把数据从数据仓库中导出和导入的需求降为最低,而这一过程,像我们介绍的那样,是需要花费大量的人力和资源的。   神话四:只有博士们才会做数据挖掘   一些人认为数据挖掘是特别复杂的,至少需要三个博士才能实施它:一位来自于统计或量化领域;一位在商业领域,他了解顾客;另一位来自于计算机科学。   而实际上,成功的项目里从没有见过一个博士的身影。   数据挖掘是在以下三个领域中通过全部专业员工的合作所达成:商业运营人员提出一套明确的企业问题来引导此项目,然后他们必需解释出现的规律;分析建模人员了解数据挖掘技术、统计学和工具,他必需建立一个牢靠的模型;IT人员供应了对处理及对数据理解的洞察力,也供应了关键的技术支持。   神话五:数据挖掘仅为大型公司所用   一个公司,不论大小,只要它能精确地反映其业务或客户的数据,它就可以建立运用这些数据的模型,以供应洞察重要的商业挑战的能力。企业具有的顾客数据量从来不

文档评论(0)

130****2066 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档