- 1、本文档共3页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种基于粗糙集的小型电子商务挖掘模型论文.doc
一种基于粗糙集的小型电子商务挖掘模型论文
[摘 要] 已有的数据挖掘模型大多是针对大型商务网站设计的,成本高,技术复杂,难于实现。本文针对为数众多的小型电子商务网站,将粗糙集与数据挖掘结合起来,建立了一个切实可行的参考模型,该模型能够有效地、自主地挖掘电子商务网站的运营状况和潜在的经济规律,从而为小型电子商务运营者提供决策参考。
[关键词] 数据挖掘;粗糙集;小型电子商务
一、 引 言
数据挖掘应用于小型电子商务.freelail以确认交易成功。
以上是电子商务的基本功能,除此之外,更需要一个高效、安全的数据挖掘工具, 挖掘潜在的、深层次的经济活动,为网站决策者提供各种分析数据和参考决策,如自动生成日报表、月报表等统计报表,以及客户行为变化、商品销售预测等。
电子商务环境下,供应商、仓储物流伙伴、客户之间要进行物流、信息流和资金流等经济活动, 数据挖掘可对物流数据、信息流数据、资金流数据进行综合挖掘。
二、 基于粗糙集的小型电子商务挖掘模型
数据挖掘的一般过程包括:数据采集、数据清洗、挖掘算法确定、数据挖掘、模式解释及知识评价。从理论研究到应用实现,涉及的技术主要有分类技术、聚类技术、粗糙集技术、统计技术和关联规则技术等。
粗糙集技术是处理知识的有效方法,已在众多领域得到广泛的应用。这里,结合粗糙集,建立如图1所示的挖掘模型。从图1中看到,采用的主要技术是粗糙集技术。以下对其中的关键步骤作进一步的分析。
三、 小型电子商务网站的数据采集
数据采集是数据挖掘的基础。电子商务网站的数据分布在服务器端、代理端和客户端。理论上讲,应采集到所有三处的数据,才能得到最完整的数据。但在实际中,由于实际情况的限制,几乎是不可能实现的。具体分析如下:
1. 服务器端数据采集。在服务器端客户的行为可以被TCP/IP包监测器跟踪,以提取客户的请求信息。服务器主要以erchandises, Number, Date, Time
可见,上述两个表格记录了挖掘所需的基本数据,使得数据采集更易于完成。
四、 粗糙集数据清洗
利用粗糙集的约简算法对数据进行清洗。主要是计算知识的约简、核、上近似及下近似(正域)。以决策规则为例。表1是某电子商店的购物记录, P,Q,R,S代表4种商品;Customer No. 为客户号。是:表示购买了某商品;否:表示没有购买某商品。
以下对表1进行粗糙集数据清洗。
根据粗糙集理论,论域U={t1,t2,t3,t4,t5,t6,t7,t8},条件属性集C={P,Q,R},决策属性集D={S}。容易计算:
U关于等价关系C的划分U/C={X1,X2,X3,X4,X5},其中,X1={t1},X2={t2,t3},X3={t4},X4={t5,t7},X5={t6,t8}。
U关于等价关系D的划分U/D={Y1,Y2},其中,Y1={t2,t3,t6,t7,t8},Y2={t1,t4,t5}。
类似地,U/{P}={{t1,t2,t3},{t4,t5,t6,t7,t8}},U/{Q}={{t1,t2,t3,t4,t6,t8},{t5,t7}},U/{R}={{t2,t3,t5,t6,t7,t8},{t1,t4}},U/{P,Q}={{t1,t2,t3},{t4,t6,t8},{t5,t7}},U/{P,R}={{t1},{t2,t3},{t4},{t5,t6,t7,t8}},U/{Q,R}={{t1,t4},{t2,t3,t6,t8},{t5,t7}}
以下计算正域:
posC(D)={ t1,t2,t3,t4,t6,t8}
pos(C-{P})(D)={ t1,t4,t2,t3,t6,t8}=posC(D)
pos(C-{Q})(D)={ t1,t2,t3,t4}≠posC(D)
pos(C-{R})(D)=φ≠posC(D)
pos(C-{P, Q})(D)={ t1,t4}≠posC(D)
pos(C-{P,R})(D)=φ≠posC(D)
pos(C-{Q,R})(D)=φ≠posC(D)
因此,C的D约简为{Q,R}。故表1经过粗糙集数据清洗后得到表2。
五、 决策规则的提取
定义决策规则为:
rij:des(Xi) → des(Yj),Xi∩Yj≠?准。
其中,des()为对等价类的描述。
定义规则rij的确定性因子μ(Xi,Yj)=| Xi∩Yj |/| Xi |。显然,0 μ(Xi,Yj)≤1。
当μ(Xi,Yj)=1时,rij是确定的;当0 μ(Xi,Yj) 1时,rij是不确定的。
这样,可得以下确定性规则:
r12:
您可能关注的文档
- 一个虚假而有意义的问题论文.doc
- 一个通用的电子现金系统的设计论文.doc
- 一个都不能少-学校文化创新内涵与路径论文.doc
- 一个非均质流水力坡度解析的新模型论文.doc
- 一事不再理原则与我国刑事再审制度论文.doc
- 一事不再理原则重述论文.doc
- 一二年级聋生语文素养形成的教学探索论文.doc
- 一些发达国家发展循环经济的经验与启示论文.doc
- 一些对罗尔斯的批评——德沃金、麦金太尔论文.doc
- 一人公司-韩国商法的困惑论文.doc
- 2015-2016学年山东省菏泽市定陶县九年级(下)期中化学试卷 .pdf
- 2019-2020年七年级语文上册第三单元10再塑生命的人课后作业习题新人教.pdf
- 2018年怎么写研发费用中材料自查报告-实用word文档 (6页) .pdf
- 2021高校实验室安全考试-高校实验室安全考试试题七(精选试题).pdf
- 2019-2020年高中美术 第8课新的探索──现代绘画、雕塑和工业设计教案.pdf
- 2019年三年级数学上册五解决问题的策略教案苏教版 .pdf
- 2016年度出版专业职业资格考试中级基础知识(第七章) .pdf
- 2019-对数函数评课稿-范文 (10页) .pdf
- 2019-2020年高一上学期期末试卷(数学) .pdf
- 2019年中级经济师《工商管理》试题及答案(卷三) .pdf
文档评论(0)