- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
维普资讯
WI;;】cI数据挖掘技在电子商务颔域中的应闽
文 /华 勇 陈祖义 王培培
1,引言 web形成的交易数据库中的数据。 web内容挖掘 (WebContentm 一
电子商务是一种借助于计算机 (2)信息选择和预处理 :任务是 ira)、web结构挖掘 (webSt:ltlC--
网络技术,通过电子交易手段来完成 从取得的web资源中剔除无用信息 turemining)、web用法挖掘 (Web
金融、物资、服务和信息等价值交换, 和将信息进行必要的整理 。例如从 usageMining)。
快速而有效地从事各种商务活动的 web文档中自动去除广告连接、去除 (1)web内容挖掘。随着www
新方法。电子商务的应用有利于满足 多余格式标记、自动识别段落或者字 上信息的迅猛增长,许多只支持由关
企业、供应商和消费者提高产品质量 段并将数据组织成规整的逻辑形式 键词和超级链接所构成的搜索引擎
和服务质量、加快服务速度、降低营 甚至是关系表。 返回的结果中有许多无用及无关的
销成本等方面的需求,帮助企业和个 (3)模式发现 :自动进行模式发 信息。这就需要开发更为有效的技术
人通过网络查询和检索信息来支持 现。可以在同一个站点内部或在多个 来支持 Web内容挖掘。web内容挖
决策。 , 站点之间进行。 掘又可以细化为直接挖掘文档 内容
电子商务模式中,采购者都需要 (4)模式分析:验证、解释上一步 和对搜索引擎查询结果的进一步处
通过 web方式与商品的供应商及其 骤产生的模式 可 以是机器 自动完 理 ,前者采用这种策略 比较杰出的
合作者之间建立信息流的交互。一方 成,也可以是与分析人员进行交互来 web查询语言 有 WebOQL,Ahoy
面通过 web方式购买者需要主动、 完成。 等。WebOQL是一个用于web页重
方便 、快捷的获得期望主题的信息, web数据挖掘作为一个完整的 构的查询语言,利用web文档的图
另一方面供应商及与之构成广域价 技术体系,在进行挖掘之前的信息获 树表示形式,可从在线的文档站点或
值链上的合作伙伴们需要通过他们 得 IR (InformationRetrieva1)和信 导游指南中获取信息。而Ahoy则利
的集成信息系统,运用知识发现技术 息抽取 IE (InfomrationExtraction) 用像搜索引擎一类的互联网服务来
把访问者 、网上购买者的访问数据从 相当重要。信息获得 (IR)的目的在于 获取与个人有关的服务 ,利用试探法
潜在的、隐含的、事先不知的状态 ,经 找到相关web文档 ,它只是把文档 识别文档中显示该文档作为个人主
过提取 、洗涤、加工变为潜力 巨大的 中的数据看成未经排序的词组的集 页的句法特征。
价值信息,从而实现网络营销的目 合,而信息抽取 (IE)的 目的在于从文 (2)web结构挖掘。web结构挖
的。web数据挖掘技术在电子商务中 档中找到需要的数据项 目,它对文档 掘是从 www 上的组织结构和链接
的应用已经引起了人们的极大兴趣 的结构合表达的含义感兴趣,它的一 关系中推导知识。由于超文本文档间
2.w.b数据挖掘概述 个重要任务就是对数据进行组织整 的关联关系使得 www 不仅仅可以
web数据挖掘指使用数据挖掘 理并适当建立索引。信息获得 (IR)和 揭示文档中所包含的信息,同时也可
技术在 www 数据 中发现潜在的、 信息抽取(IE)技术的研究已近有很长 以揭示文档间的关联关系所代表的
有用的模式或信息。web数据挖掘研 时间,随着 Web技术的发展,基于 信息。利用这些信息可以对页面进行
究覆盖了多个研究领域 ,包括数据库 web技术的IR、IE得到了更多的重 排序,发现重要的页面。挖掘Web结
技术、信息获取技术、统计学、人工智 视。在 w
原创力文档


文档评论(0)