- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
计算机应用新领域一数据挖掘前景及应用探究
摘要:本文首先介绍了数据挖掘的发展背景和数据挖掘的 概念及应用价值;然后对数据挖掘中的价值实现难点进行分 析;在此基础上结合化妆品企业数据挖掘的具体案例进行分 析,验证了数据挖掘的商业价值;最后在此基础上分析对数 据挖掘的发展进行展望,指出未来数据挖掘发展的三大趋 势。
关键词:数据挖掘;商业智能;关联规则;Apriori算 法
中图分类号:TP391文献标识码:A文章编号:
1007-9599 (2012) 17-0000-02
1数据挖掘概念
数据挖掘(Data Mining)是指基于一定业务目标下从 海量数据中挖取潜在的、合理的并能被人理解的模式的高级 处理过程。与传统的数据分析最大本质区别是数据分析所得 到的信息具有先前未知、有效和实用三个特征,即数据挖掘 是发现那些不能靠直觉发现的信息或知识,甚至违背直觉的 信息或知识,挖掘出来的信息越出乎意料越有价值。
2数据挖掘的价值实现难点分析
数据挖掘是数据库中的知识发现,从知识发现到知识应 用、再到价值评估是一条数据挖掘价值变现的过程,虽然数 据挖掘重要性毋庸置疑;但事实上其转变商业价值之路仍有 较多困难。
2.1知识发现。知识发现是这条路的始端,直接决定了 最终价值的高度。挖掘的方法是通用的,但难度不在挖掘技 术,而在于实施人员对数据业务的理解,在于数据的质量。 实施人员必须清楚的知道数据回收的场景和原理,稍有沟通 缺失,都会影响知识的质量度。
2.2知识应用。发现了知识,只是迈出第一步,需要将 相关的知识发现交给业务部门进行运营使用。不管是以甲方 公司还是乙方公司的形式存在,难点在于语言的翻译转发。 数据挖掘的语言形式是概率形式,类如连续三天内在站内 搜索超过10次,浏览搜索结果相关页面20次以上的用户最 终购买概率为42%”,因此需要实施人员深谙运营知识,将 挖掘结果语言转化成运营结果语言,最终成为友好的商业运 营智慧。应用的过程还需要及时跟踪、分析、调整,毕竟市 场是多变的,分析与执行就像左脑和右脑,两者距离的远近, 影响结果的优劣。
2.3价值评估。数据挖掘的效果评估决定最终的话语和 地位。从结果来看,如果结果有效,如何界定是知识有效还 是执行有效;如果结果无效,如何界定是知识无效还是执行 无效;如果知识有效,如何界定是通过挖掘发现还是已知发 现。如果不能很清晰的界定,数据挖掘的存在价值都会大打 折扣。曾经有个笑话,“通过我们海量数据发现,中国的 15-20岁的男性网民最喜欢使用QQ即时通讯工具”,这样的 知识发现虽然是个笑话,但在现实行业里是个不争的事实。 数据挖掘的价值应当是显现的、直观的、令人信服的,不在 于挖掘的技术多么高深,而在于整个体系的搭建和成果的展 现,做的再好,看不到效果,等于无效。
以上三点就像三座大山,压在了数据挖掘的变现之路, 下面笔者将论述数据挖掘的商业应用价值。
3数据挖掘应用一关联规则在化妆品营销当中运用
3.1关联规则概念。关联规则指通过分析发现数据库中
不同变量或个体(例如商品间的关系及年龄与购买行为上关 系)之间的关系程度,用以找出顾客购买行为模式。
3. 2 Apriori算法步骤。(1)首先设定最小支持度及最
小依赖度。(2) Apriori算法使用了候选物项集合的概念;
首先产生候选项集合,若候选物集合的支持度大于或等于最 小支持度,则候选物项集合为高频物项集合。(3)在数据库 中读取所有交易,得出候选单物项集合的支持度,再找出髙 频单物项集合,并利用这些高频单物项集合的结合,产生候 选2物项集合。(4)再次扫描数据库,得出候选2物项集合 的支持度,接着找出高频2物项集合,并利用这些高频2物
项集合的结合,产生候选3物项集合。(5)重复扫描数据库, 与最小支持度比较,产生高频物项集合,再结合下一级候选 物项集合,直到不再结合出新的候选物项集合为止。
当然在采用Apriori算法时,因计算物项太多而造成运 行缓慢,主要原因是髙频物项集合产生过多的物项集合,尤 其是候选2物项集合的情况最为严重。
3.3关联规则在零售行业营销处理的思路。采用 Apriori算法扫描企业数据库,得出最终频繁产品集合。假 定最终频繁产品集合为{1, 2, 3, 4, 5, 6),此时总共可以 找到类似啤酒尿布的组合共计6+45+140+225=416种关联产 品推荐组合,营销人员可以制定相应规划,即当某顾客购买 任意两个或三个或四个或五个产品推出相应产品进行关联 销售,提高销售机会。根据企业数据库可以得到相应的置信 度;进而提出商业建议进行关联产品销售,提高产品销售概 率。
3.4案例分析:关联规则在化妆品行业营销实践。化妆 品企业中会有很多交易,那么如何发现其中规律进行关联营 销提高销售机会呢?为了计
您可能关注的文档
- 计算机网络主要威胁和防范措施.docx
- 计算机维护技术在企业中应用.docx
- 计算机维护教学方法探究.docx
- 计算机系统组建和办公自动化项目化教学实施方案.docx
- 计算机信息处理系统可靠性探究.docx
- 计算机信息管理系统在图书馆中应用研究.docx
- 计算机信息管理系统在血型参比实验室中的应用.docx
- 计算机信息管理专业实习报告.docx
- 计算机信息技术助力我国铁路事业高速发展.docx
- 计算机信息数据安全研究及加密技术探析.docx
- 六年级数学下册教学课件《解比例》.pptx
- 8.21.5 鸟类的生殖与发育(课件)八年级生物下册课件(苏教版).pptx
- 钠离子电池项目智能制造方案(范文参考).docx
- 2023-2024学年吉林省吉林市舒兰市七年级(上)期末语文试卷.docx
- 2024年吉林省吉林市丰满区亚桥实验学校中考数学三模试卷.docx
- 2023-2024学年吉林省辽源市东辽县七年级(上)期末英语试卷.docx
- 2023-2024学年吉林四平九年级数学第一学期期末水平检测试卷.docx
- 2023-2024学年吉林市蛟河市三校联考九年级(上)期末英语试卷.docx
- 2023-2024学年吉林松原九年级英语上册考场实战试卷.docx
- 电解液新材料项目智能制造方案.docx
文档评论(0)