浅谈网络数据挖掘在电子商务中应用.docVIP

下载本文档

0
0
约3.12千字
约 7页
2018-09-14 发布于福建
举报
版权申诉

浅谈网络数据挖掘在电子商务中应用.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

浅谈网络数据挖掘在电子商务中应用

浅谈网络数据挖掘在电子商务中应用　　摘要：电子商务是一种计算机网络信息技术，通过电子交易手段来完成金融、物资、服务和信息等价值交换，快速而有效地从事各种商务活动的新方法。　　关键词：网络数据挖掘电子商务应用　　　　0 引言　　　　在电子商务模式下，商品的采购者都需要通过Web方式与商品的供应商及其合作者之间建立信息流的交互，但最先进的搜索引擎也只能找到Web网址的1/3网页，并且Web是无结构的、动态的，页面相当复杂。人们从成千上万的Web站点中找到有用的数据就变得比较困难。网络数据挖掘技术是克服这些缺点的最理想的工具，是一个有效的途径，利用数据挖掘技术可从Web中获取人们感兴趣的，潜在的有用模式和隐藏的信息，并可对数据进行分析，预测未来。如何把Web上的数据转换生成为有趣的知识模式的需求，激发了数据挖掘技术在Web上的应用，同时这种挑战性的工作也吸引了众多人的关注，成为数据挖掘领域的活跃主题。　　　　1 网络数据挖掘的概念和分类　　　　数据挖掘是一门受到来自各种不同领域的研究者关注的交叉性学科。网络数据挖掘就是从大量的Web文档和Web活动页中发现、抽取感兴趣的、潜在的有用模式和隐含的、事先未知的、潜在的信息。网络数据挖掘是对数据挖掘的一种新的应用。但不同于传统的数据挖掘。其主要区别在于：传统的数据挖掘的对象局限于数据库中的结构化数据。并利用关系表等存储结构来挖掘知识。而网络数据挖掘的对象则是半结构化或非结构化数据。网络数据挖掘技术的分类：一般而言，网络数据挖掘可分为3类：Web内容挖掘、Web 结构挖掘和Web使用记录挖掘。　　1.1 Web内容挖掘：Web内容挖掘可以看作对基本搜索引擎所完成工作的扩展。多数搜索引擎是基于关键字的，Web内容挖掘超出了基本信息检索的范围。使用象概念层次、同义词、用户信息以及分析网页之间的链接等技术可以合引擎的效果得以改进。传统的搜索引擎使用看爬虫搜索和搜集信息，用索引动手术存储网页信息，使用查询处理为用户提供快速、准确的信息。　　1.2 Web结构挖掘：Web结构挖掘可以看作是为万维网（或者其中的一部分）的组织建立一个模型。模型可以用来对网页分类或者为网页建立相似性度量。　　1.3 Web使用挖掘：Web使用挖掘的研究对象是Web使用数据或者Web日志。Web使用挖掘可以应用于多种不同目的。通过分析一个用户访问的网页序列，可以得到用户的简档信息，从而可以帮助实现个性化。使用网站挖掘，可以评估网页的质量和效果。　　　　2 电子商务中的Web数据挖掘　　　　电子商务中的网络数据挖掘的过程一般由3个主要的阶段组成：数据准备、挖掘操作、结果表达和解释。电子商务中的网络数据挖掘数据的方法分为以下5种：　　2.1 路径分析：它可以被用于判定在一个Web 站点中最频繁访问的路径。还有一些其它的有关路径的信息通过路径分析也可以得出。通过路径分析，可以改进页面及网站结构的设计。　　2.2 关联规则的发现：关联规则就是为了发现事物之间的意义的联系和规则。进行Web上的数据挖掘。构建关联模型，可以更好地组织站点，减少用户过滤信息的负担。例如，用关联规则技术，我们可以发现：如果客户在一次访问行为中，访问了页面/company/product1时，一般也会访问页面/company/product2。得用这些关联模型，我们可以更好地组织站点，减少用户过滤信息的负担。　　2.3 序列模型的发现：序列模式分析的侧重点在于分析数据间的前后或因果关系，就是在时间有序的事务集中，找到那些“一些项跟随另一些项”的内部事务模式。发现序列模式能够便于电子商务的组织者预测客户的访问模式，对客户提供个性化的服务。例如：若ATT股票连续上涨两天且DEC股票不下跌，则第三天IBM股票上涨的可能性为75%；现比如，在/company/product1上进行在线定购的顾客，有60%的人在过去15天内也在/company/product4处下过定单。　　2.4 分类规则的发现：数据分类是基于数据的某些属性的值进行的。数据分类方法很多，最为典型的是基于决策树的分类方法。它是从实际数据中构造决策树，是一种有指导的学习方法。得到分类后，就可以针对这一类客户的特点展开商务活动，提供有针对性的个性化的信息服务。比如，在电子商务中通过数据挖掘后，发现在/compqny/product2进行过在线订购的客户中有60%是20-30 岁生活在大中城市的年轻人。得到分类数据后，就可以针对某一类客户展开商务活动，提供有针对性的个性化的信息服务。　　2.5 聚类分析的发现：聚类分析法输入集是一级未标定的记录。其目的是根据一定的规则，合理地划分记录集合，并用显式或隐式的方法描述不