- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
面向电子商务数据挖掘系统设计
面向电子商务数据挖掘系统设计
[摘 要] 本文分析了面向电子商务的数据挖掘的优势,论述了数据挖掘的步骤,设计了数据挖掘系统的三层结构,指出面向电子商务的数据挖掘系统能够从大量繁杂的数据中找出真正有价值的信息和知识,更符合现代社会的竞争趋势要求。
[关键词] 电子商务;数据挖掘;系统设计
[中图分类号]F724.6[文献标识码]A[文章编号]1673-0194(2008)18-0097-03
电子商务是指个人或企业通过Internet网络,采用数字化电子方式进行商务数据交换和开展商务活动。电子商务的发展给企业、个人和社会带来的好处是全方位的,它把人类真正地带入信息化社会。然而电子商务在加速社会电子化进程的同时,也使“数据爆炸”问题进一步加剧,促进了对新技术的需求。此外,时代的发展赋予电子商务更广泛的含义,它不仅包括电子贸易,还包括物流及供应链管理(SCM)、企业资源规划(ERP)、客户关系管理(CRM)等。这些都迫使拥有海量数据的电子商务公司从已有数据中寻找某些规律性,以帮助决策层制订计划和策略,更好地开展商务活动。
数据挖掘,也称知识发现(KDD,Knowledge Discovery in Databases),是从大量数据中提取或“挖掘”知识[1]。数据挖掘通过发现有用的新规律和新概念,提高了数据拥有者对大量原始数据的深层次理解、认识和应用。数据挖掘技术是目前国际上数据库和信息决策领域最前沿的研究方向之一,引起了学术界和工业界的广泛关注。
在电子商务平台上进行数据挖掘也已成为一个研究热点。对于电子商务公司每天处理的大量数据,利用数据挖掘技术可以高度自动化地分析数据,做出归纳性推理,从中挖掘出潜在的模式,并预测未来,帮助企业决策者调整市场策略,减少风险,做出正确决策。
1 面向电子商务的数据挖掘的优势分析
1. 1提供海量的数据和信息
面向电子商务的数据挖掘最大优势在于电子商务行为将会产生海量数据,而这正是进行数据挖掘的基础。现在海量数据至少是在100GB以上的数量级,在这种规模的数据上挖掘才是有意义的,通常情况下有条件进行数据挖掘的应用领域并不是很多。据统计,如果一个电子商务网站平均每小时卖出5件物品,那么它一个月的平均点击量是160万次。这个点击量会产生巨大的Web日志(记载页面访问的情况)。如果电子商务站点设计得好,就可以获得各种商务的或者是用户访问的信息。这些信息包括:商品和商品的属性、商品的归类信息(当同时展示多种商品时,归类信息是非常有用的)、促销信息、关于访问的信息、关于客户的信息等。在一个电子商务网站当中,客户访问网站的一举一动都可以记录下来[2]。
1. 2产生良好的数据
从电子商务站点搜集的都是电子数据,无需人工输入或者从历史系统进行整合,从而也减少了一些人工输入的错误。可以通过良好的站点设计,直接获得跟数据挖掘有关的数据。可以通过良好的站点设计,将数据采样的颗粒度控制在用户级别或者是Session级别,而不是页面级别。
1. 3研究成果容易转化
在电子商务中,很多知识发现都可以直接应用。历史上的数据挖掘研究有过很多的知识发现,但是这些知识发现却很少在实际的商业应用中产生效果。要应用这些发现的知识可能意味着要进行复杂的系统更改、流程更改或是改变人们的办事习惯,这在现实中是非常困难的。而在电子商务中,很多知识发现都可以直接应用。比如,改变站点的设计(改变布局,进行个性化设计等),开始有目标的促销,根据对广告效果的统计数据改变广告策略,可以很容易地提供捆绑销售。
1. 4投资收益容易衡量
在电子商务中衡量革新的投资收益非常容易,销售变化的报表可以自动产生,客户对电子邮件和电子调查的反馈都可以在短短的几天内得到,而不必等几个月,电子商务乃至整个互联网都是传统商业的理想实验室。
2 面向电子商务的数据挖掘的步骤
2. 1数据预处理
我们所得到的数据一般都具有不完全性、冗余性和模糊性,要有效地挖掘出知识,就必须提供干净、准确、简洁的数据。预处理主要对用户访问日志进行数据清洗、用户唯一性识别、用户会话识别、完善访问路径和事务识别等处理。
2. 2模式发现
模式发现阶段就是利用挖掘算法挖掘出有效的、新颖的、潜在的、有用的及最终可以理解的信息和知识。在经过数据预处理阶段后,可根据不同的需求选择模式发现技
术[3],如统计分析、关联规则、时序模式、路径分析及聚类、分类技术。
2. 3用户交互
数据挖掘过程需要用户交互,这种交互主要有两方面:一是用户向挖掘系统提供参数或者约束条件指导挖掘;二是因为挖掘目的不确定,所以挖掘有时会返回很多的结果,其中大
原创力文档


文档评论(0)