一种基于粗糙集的小型电子商务挖掘模型论文.docVIP

一种基于粗糙集的小型电子商务挖掘模型论文.doc

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种基于粗糙集的小型电子商务挖掘模型论文.doc

  一种基于粗糙集的小型电子商务挖掘模型论文 [摘 要] 已有的数据挖掘模型大多是针对大型商务网站设计的,成本高,技术复杂,难于实现。本文针对为数众多的小型电子商务网站,将粗糙集与数据挖掘结合起来,建立了一个切实可行的参考模型,该模型能够有效地、自主地挖掘电子商务网站的运营状况和潜在的经济规律,从而为小型电子商务运营者提供决策参考。 [关键词] 数据挖掘;粗糙集;小型电子商务 一、 引 言 数据挖掘应用于小型电子商务.freelail以确认交易成功。 以上是电子商务的基本功能,除此之外,更需要一个高效、安全的数据挖掘工具, 挖掘潜在的、深层次的经济活动,为网站决策者提供各种分析数据和参考决策,如自动生成日报表、月报表等统计报表,以及客户行为变化、商品销售预测等。 电子商务环境下,供应商、仓储物流伙伴、客户之间要进行物流、信息流和资金流等经济活动, 数据挖掘可对物流数据、信息流数据、资金流数据进行综合挖掘。 二、 基于粗糙集的小型电子商务挖掘模型 数据挖掘的一般过程包括:数据采集、数据清洗、挖掘算法确定、数据挖掘、模式解释及知识评价。从理论研究到应用实现,涉及的技术主要有分类技术、聚类技术、粗糙集技术、统计技术和关联规则技术等。 粗糙集技术是处理知识的有效方法,已在众多领域得到广泛的应用。这里,结合粗糙集,建立如图1所示的挖掘模型。从图1中看到,采用的主要技术是粗糙集技术。以下对其中的关键步骤作进一步的分析。 三、 小型电子商务网站的数据采集 数据采集是数据挖掘的基础。电子商务网站的数据分布在服务器端、代理端和客户端。理论上讲,应采集到所有三处的数据,才能得到最完整的数据。但在实际中,由于实际情况的限制,几乎是不可能实现的。具体分析如下: 1. 服务器端数据采集。在服务器端客户的行为可以被TCP/IP包监测器跟踪,以提取客户的请求信息。服务器主要以erchandises, Number, Date, Time 可见,上述两个表格记录了挖掘所需的基本数据,使得数据采集更易于完成。 四、 粗糙集数据清洗 利用粗糙集的约简算法对数据进行清洗。主要是计算知识的约简、核、上近似及下近似(正域)。以决策规则为例。表1是某电子商店的购物记录, P,Q,R,S代表4种商品;Customer No. 为客户号。是:表示购买了某商品;否:表示没有购买某商品。 以下对表1进行粗糙集数据清洗。 根据粗糙集理论,论域U={t1,t2,t3,t4,t5,t6,t7,t8},条件属性集C={P,Q,R},决策属性集D={S}。容易计算: U关于等价关系C的划分U/C={X1,X2,X3,X4,X5},其中,X1={t1},X2={t2,t3},X3={t4},X4={t5,t7},X5={t6,t8}。 U关于等价关系D的划分U/D={Y1,Y2},其中,Y1={t2,t3,t6,t7,t8},Y2={t1,t4,t5}。 类似地,U/{P}={{t1,t2,t3},{t4,t5,t6,t7,t8}},U/{Q}={{t1,t2,t3,t4,t6,t8},{t5,t7}},U/{R}={{t2,t3,t5,t6,t7,t8},{t1,t4}},U/{P,Q}={{t1,t2,t3},{t4,t6,t8},{t5,t7}},U/{P,R}={{t1},{t2,t3},{t4},{t5,t6,t7,t8}},U/{Q,R}={{t1,t4},{t2,t3,t6,t8},{t5,t7}} 以下计算正域: posC(D)={ t1,t2,t3,t4,t6,t8} pos(C-{P})(D)={ t1,t4,t2,t3,t6,t8}=posC(D) pos(C-{Q})(D)={ t1,t2,t3,t4}≠posC(D) pos(C-{R})(D)=φ≠posC(D) pos(C-{P, Q})(D)={ t1,t4}≠posC(D) pos(C-{P,R})(D)=φ≠posC(D) pos(C-{Q,R})(D)=φ≠posC(D) 因此,C的D约简为{Q,R}。故表1经过粗糙集数据清洗后得到表2。 五、 决策规则的提取 定义决策规则为: rij:des(Xi) → des(Yj),Xi∩Yj≠?准。 其中,des()为对等价类的描述。 定义规则rij的确定性因子μ(Xi,Yj)=| Xi∩Yj |/| Xi |。显然,0 μ(Xi,Yj)≤1。 当μ(Xi,Yj)=1时,rij是确定的;当0 μ(Xi,Yj) 1时,rij是不确定的。 这样,可得以下确定性规则: r12:

文档评论(0)

ggkkppp + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档