- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
放射免疫学杂志
维普资讯
Web数据挖掘及其在电子商务网站中的应用
杨 宇 匡立人 张志平
(新余高等专科学校计算机系,江西新余 338031;华东师范大学软件学院,上海200062)
摘【 要】Intemet应用的普及使得数据挖掘技术的重点已经从传统的基于数据库的应用转移到了基于Web的应用,电子商
务网站每天都会产生大量的数据,运用数据挖掘技术可以从这些数据 中发现对市场分析及预测非常有益的信息。本文讨论了Web
数据挖掘技术在电子商务中的应用。
[关键词】Web数据挖掘;电子商务网站;weblog
在 Intemet浪潮 的冲击下.人们面临着数据爆炸的挑战; 挖掘,智能查询,建立MetaWeb数据仓库等。一般,对 b
随着数据挖掘(DataMining,DM肢术的迅速发展及数据库管理 做如下定义:Web数据挖掘是指web从文档结构和使用的集
技术的广泛应用.人们积累的数据越来越多。如何从浩如烟海 合口C中发现隐含的模式P。如果将C看作输入,P看作输出,
的数据中找到内在的规律.如何更方便地传递 、交流、获取有用 那么Web挖掘的过程就是从输入到输出的一个映射:
的信息,挖掘这些激增数 据背后隐藏的重要信息已成为当前 与传统数据和数据仓库相比,Web上的信息是非结构化
高科技领域研究的热点。经过长期对数据库的研究与开发 ,产 或半结构化的、动态的、并且是容易造成混淆的,所以很难直接
生了数据挖掘技术,数据挖掘技术不仅能够对过去的数据进行 以Web网页上的数据进行数据挖掘,而必须经过必要的数据
查询和遍历,并且能够找出数 据间的潜在联系,从而促进信息 处理。典型Web数据挖掘的处理流程如图 I所示。
的传递。他使数据库技术进入一个更高的阶段。 (I)查找资源:任务是从 目标 Web文档中得到数据,值得
Web是一个巨大的、广泛分布、高度异构 、半结构化、超文 注意的是有时信息资源不仅限于在线Web文档,还包括电子
本 /超媒体、相互联系并 且不断进化的信息仓库;也是一个巨 邮件、电子文档、新闻组,或者网站的日志数据甚至是通过
大的文档累积的集合,包括超链接信息、访问及使用信息。传统 Web形成的交易数据库中的数据。
的数据挖掘大多是针对关系数据库或数据仓库 的,处理的数据 (2)信息选择和预处理:任务是从取得的Web资源中剔除
具有完整的结构,但是Web包含各种类型的数据,现有的数据 无用信息和将信息进行必要的整理。例如从Web文档中自动
库管理系统无法操纵和管理大量的非结构化数据,其用户群 去除广告连接、去除多余格式标记、自动识别段落或者字段并
体也表现出多样性的特点。Web数据挖掘起源于数据挖掘,目 将数据组织成规整的逻辑形式甚至是关系表。
的在于可以处理非结构化 的数据,Web数据的非结构化这一 (3)模式发现:自动进行模式发现。可以在同一个站点内部
显著特征使Web数据挖掘更加复杂。 或在多个站点之间进行。
一 、Web数据挖掘 (4)模式分析:验证、解释上一步骤产生的模式。可以是机
数据挖掘是通过挖掘数据仓库中存储的大量数据,从中发 器 自动完成 ,也可以是与分析人员进行交互来完成。
现有意义的新的关联模式和趋势的过程。从商业的角度定义, 二、Web数据挖掘在电子商务网站中应用
数据挖掘是一种新的商业信息处理技术 ,其主要特点是对商业 (一 )电子商务网站中Web挖掘的数据源
数据库中的大量业务数据进行抽取、转换、分析和其它模型化 在 Web上可以用来作为数据挖掘分析的数据量比较大 ,
处理,从中提取辅助商业决策的关键性数据。 而且类型众多,总结起来有以下几种类型的数据可用于Web
Web挖掘指使用数据挖掘技术在Www数据中发现潜在
您可能关注的文档
- ACI患者血清Hsp70、Copeptin和S100B水平与认知功能障碍的相关性分析.pdf
- AXIS内固定系统在枕颈融合术中的应用.pdf
- Banach空间中涉及非扩张映象的Halpern迭代算法的几乎T稳定性.pdf
- CA19-9、CA50、CA242和TSGF联检对胰腺癌的诊断价值.pdf
- CA27、CA29和CA15-3在乳腺癌诊断与肿瘤分期中的应用价值.pdf
- CA125、Tg联检在甲状腺良、恶性肿瘤的临床意义.pdf
- CHF患者治疗前后血浆BNP和血清SOD、IL-2检测的临床意义.pdf
- COPD患者治疗前后血浆BNP和血清NGF、CTGF检测的临床意义.pdf
- DM2患者血清CysC、β2-m及sE-selectin检测的临床意义.pdf
- FNAC诊断骨肉瘤220例分析.pdf
文档评论(0)