- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
魁塾蕊凰
基于网络数据挖掘技术的电子商务应用
陈文渊
(广发证券珠海情侣南路证券营业部,广东珠海519020)
瞒要】数据挖掘定义为是从存放在数据库、数据仓库或其他信息库中的大量数据中挖掘有趣知识的过程。对数据挖掘的基本特点与流鼹
和电子商务中wcb数据挖掘与数据源进行了分析,并对数据挖掘技术在电子商务领域的应用进行了研究探讨。
鹾罐词1数据挖掘;电子商务;数据源;应用
1数据挖掘的基本特点与流程分析
数据挖掘定义为是从存放在数据库、数据仓库或其他信息库中的 容:不同网页间的超链接:网页内部的URL字符串中的目录路径结构
大量数据中挖掘有趣知识的过程,根据这一定义,我们可以了解到一个 信息:网页内部内容的可以用HTML、×ML表示成的树形结构信息。
数据挖掘系统应具有以下特点:一是能处理大数据量数据;二是处理知
识或模式的高级系统或智能系统;三是具有确定、识别用户兴趣所在的 掘,在新兴的电子商务领域有重要意义,它通过挖掘相关的Web日志
能力。系统对兴趣度的处理是根据用户同系统的交互和系统自身知识、 纪录,来发现用户访问Web页面的模式,通过分析日志纪录中的规
信息的积累,通过智能的方法加以确定。 律,可以识别用户的忠实度、喜好、满意度,因而可以发现潜在用户,
一般来说,数据挖掘过程包括七个步骤:一是数据清理:针对所 增强站点的服务竞争力。
要处理的数据填充空缺的值,识别孤立点,消除噪声,纠正数据中的不 在数据挖掘中一个很重要的步骤就是采集数据。在Web上可以用
一致性:二是数据集成:多种数据源可以组合在一起;三是数据选择: 来作为数据挖掘分析的数据量比较大,而且类型众多。电子商务的数据
从数据库中检索与分析任务相关的数据;四是数据变换:数据变换或统 挖掘技术中,数据的来源主要有以下几个方面·
—成适合挖掘的形式,如通过汇总和聚集操作;五是数据挖掘:这是最 一是服务器数据。客户访问站点时会在Web服务器上留下相应的
基本的步骤,使用智能方法提取数据模式;六是模式评估:根据某种兴 日志数据,这些日志数据通常以文本文件的形式存储在服务器上。一般
包括sever
趣度的度量指标,识别表示知识的真正有趣的模式;七是知识表示:使 logs、errorlogs、cookielogs等。二是查询数据。它是电
用可视化和知识表示技术,向用户提供挖掘的知识。 -7-1商务站点在服务器上产生的一种典型数据。三是在线市场数据。这类
而基于此,数据挖掘系统具有以下几个主要部分: 数据主要是传统关系数据库里存储的有关电子商务站点信息、用户购买
~是数据库、数据仓库或其他信息库:这是一个或一组数据库、
数据仓库、电子表格或其他类型的信息库,可以在数据上进行数据清理 面的内容,包括本文、图片、语音、图像等。五是Web页面超级链接
和集成。 关系。主要是指页面之间存在的超级链接关系,这也是一种重要的资
二是数据库或数据仓库服务器:根据用户的数据挖掘请求,数据 源。六是客户登记信息。客户登记信息是指客户通过Web网页输入
库或数据仓库服务器负责提取相关数据,以用户为主导的交互式数据挖 的、要提交给服务器的相关用户信息,这些信息通常是关于用户的人口
掘过程—般是通过系统的用户界面模块,将用户的搜索指令转化为一组 特征信息。
标准的SQL语句,交由服务器去执行。 3Web数据挖掘在电子商务中的应用
三是数据挖掘引擎:这是数据挖掘系统的基本部分,是由一组以 一是发现潜在客户。通过Web数据挖掘,对新访问者的网页浏览
系统为主导的数据挖掘功能模块组成的,通过一定算法及对相关数据的 纪录进行分析,就可以判断出该访问者是属于哪一类客户,是有利可图
遍历等操作,对数据进行特征化分析,关联分析,分类分析
您可能关注的文档
- 【论文】基于平衡计分卡下高校教师绩效评估体系设计.pdf
- 【论文】基于平衡记分卡的医院绩效管理的实施和成效.pdf
- 【论文】基于企业2_0的群体式创新模式研究_金昕.pdf
- 【论文】基于企业脆弱性的营销道德风险评价.pdf
- 【论文】基于企业的效益评价与网络营销运作策略.pdf
- 【论文】基于企业关系需求层次论的关系营销实践研究.pdf
- 【论文】基于企业联盟的失败项目资源再配置研究.pdf
- 【论文】基于企业内部经营环境转变的HRM应对策略.pdf
- 【论文】基于企业评价的企业家选择与培育机制的实证研究框架.pdf
- 【论文】基于企业生命周期的中小企业财务目标价值取向研究――兼论鄂东中小企业初创期财务目标实现途径.pdf
文档评论(0)