网站大量收购闲置独家精品文档,联系QQ:2885784924

计算机应用新领域数据挖掘前景及应用探究.docx

计算机应用新领域数据挖掘前景及应用探究.docx

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
计算机应用新领域一数据挖掘前景及应用 探究 摘要:本文首先介绍了数据挖掘的发展背景和数据挖掘的 概念及应用价值;然后对数据挖掘中的价值实现难点进行分 析;在此基础上结合化妆品企业数据挖掘的具体案例进行分 析,验证了数据挖掘的商业价值;最后在此基础上分析对数 据挖掘的发展进行展望,指出未来数据挖掘发展的三大趋 势。 关键词:数据挖掘;商业智能;关联规则;Apriori算 法 中图分类号:TP391文献标识码:A文章编号: 1007-9599 (2012) 17-0000-02 1数据挖掘概念 数据挖掘(Data Mining)是指基于一定业务目标下从 海量数据中挖取潜在的、合理的并能被人理解的模式的高级 处理过程。与传统的数据分析最大本质区别是数据分析所得 到的信息具有先前未知、有效和实用三个特征,即数据挖掘 是发现那些不能靠直觉发现的信息或知识,甚至违背直觉的 信息或知识,挖掘出来的信息越出乎意料越有价值。 2数据挖掘的价值实现难点分析 数据挖掘是数据库中的知识发现,从知识发现到知识应 用、再到价值评估是一条数据挖掘价值变现的过程,虽然数 据挖掘重要性毋庸置疑;但事实上其转变商业价值之路仍有 较多困难。 2.1知识发现。知识发现是这条路的始端,直接决定了 最终价值的高度。挖掘的方法是通用的,但难度不在挖掘技 术,而在于实施人员对数据业务的理解,在于数据的质量。 实施人员必须清楚的知道数据回收的场景和原理,稍有沟通 缺失,都会影响知识的质量度。 2.2知识应用。发现了知识,只是迈出第一步,需要将 相关的知识发现交给业务部门进行运营使用。不管是以甲方 公司还是乙方公司的形式存在,难点在于语言的翻译转发。 数据挖掘的语言形式是概率形式,类如连续三天内在站内 搜索超过10次,浏览搜索结果相关页面20次以上的用户最 终购买概率为42%”,因此需要实施人员深谙运营知识,将 挖掘结果语言转化成运营结果语言,最终成为友好的商业运 营智慧。应用的过程还需要及时跟踪、分析、调整,毕竟市 场是多变的,分析与执行就像左脑和右脑,两者距离的远近, 影响结果的优劣。 2.3价值评估。数据挖掘的效果评估决定最终的话语和 地位。从结果来看,如果结果有效,如何界定是知识有效还 是执行有效;如果结果无效,如何界定是知识无效还是执行 无效;如果知识有效,如何界定是通过挖掘发现还是已知发 现。如果不能很清晰的界定,数据挖掘的存在价值都会大打 折扣。曾经有个笑话,“通过我们海量数据发现,中国的 15-20岁的男性网民最喜欢使用QQ即时通讯工具”,这样的 知识发现虽然是个笑话,但在现实行业里是个不争的事实。 数据挖掘的价值应当是显现的、直观的、令人信服的,不在 于挖掘的技术多么高深,而在于整个体系的搭建和成果的展 现,做的再好,看不到效果,等于无效。 以上三点就像三座大山,压在了数据挖掘的变现之路, 下面笔者将论述数据挖掘的商业应用价值。 3数据挖掘应用一关联规则在化妆品营销当中运用 3.1关联规则概念。关联规则指通过分析发现数据库中 不同变量或个体(例如商品间的关系及年龄与购买行为上关 系)之间的关系程度,用以找出顾客购买行为模式。 3. 2 Apriori算法步骤。(1)首先设定最小支持度及最 小依赖度。(2) Apriori算法使用了候选物项集合的概念; 首先产生候选项集合,若候选物集合的支持度大于或等于最 小支持度,则候选物项集合为高频物项集合。(3)在数据库 中读取所有交易,得出候选单物项集合的支持度,再找出髙 频单物项集合,并利用这些高频单物项集合的结合,产生候 选2物项集合。(4)再次扫描数据库,得出候选2物项集合 的支持度,接着找出高频2物项集合,并利用这些高频2物 项集合的结合,产生候选3物项集合。(5)重复扫描数据库, 与最小支持度比较,产生高频物项集合,再结合下一级候选 物项集合,直到不再结合出新的候选物项集合为止。 当然在采用Apriori算法时,因计算物项太多而造成运 行缓慢,主要原因是髙频物项集合产生过多的物项集合,尤 其是候选2物项集合的情况最为严重。 3.3关联规则在零售行业营销处理的思路。采用 Apriori算法扫描企业数据库,得出最终频繁产品集合。假 定最终频繁产品集合为{1, 2, 3, 4, 5, 6),此时总共可以 找到类似啤酒尿布的组合共计6+45+140+225=416种关联产 品推荐组合,营销人员可以制定相应规划,即当某顾客购买 任意两个或三个或四个或五个产品推出相应产品进行关联 销售,提高销售机会。根据企业数据库可以得到相应的置信 度;进而提出商业建议进行关联产品销售,提高产品销售概 率。 3.4案例分析:关联规则在化妆品行业营销实践。化妆 品企业中会有很多交易,那么如何发现其中规律进行关联营 销提高销售机会呢?为了计

文档评论(0)

ggkkppp + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档