第12章 数据挖掘应用Chapter 12 Applications of Data Mining课件.pptVIP

第12章 数据挖掘应用Chapter 12 Applications of Data Mining课件.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
用户对话识别 15:33:04/2-Jan-01 GET Index.htm /res.php 15:33:04/2-Jan-01 GET 1.htm /index.htm 15:33:04/2-Jan-01 GET A.htm /index.htm 15:35:11/2-Jan-01 GET B.htm /A.htm 15:30:01/2-Jan-01 GET Index.htm /link.htm 15:30:01/2-Jan-01 GET 1.htm /index.htm 15:30:01/2-Jan-01 GET A.htm /index.htm 15:37:09/2-Jan-01 GET E.htm /C.htm 15:35:11/2-Jan-01 GET C.htm /A.htm Mozilla/4.0(IE5.0W98) User1: Mozilla/4.0(IE4.0NT) User2: 精品 页面视图识别 1-A /res.php B A.htm 1-A /link.htm E C.htm 1-C A.htm Mozilla/4.0(IE5.0W98) User1: Mozilla/4.0(IE4.0NT) User2: 精品 路径补全 解决由于Cache带来的问题路径不全的问题 精品 数据挖掘 统计分析 频繁项集和关联规则 聚类分析和分类 序列模式 精品 统计分析 主要用于改进系统的性能、设计等 包括: 1) 最频繁访问的页面 2) 每个页面的平均访问时间 3) 通过一个站点的平均时间 精品 频繁项集和关联规则 可以寻找出经常频繁访问的page组, 可用于修改Web 站点的设计或提前缓冲页面,改进系统的性能。 精品 包括两方面的应用: *user 用于Market segmentation(市场分割)和个人内容定制 *page(content) 后者主要用于IR和冲浪辅助 聚类和分类 精品 序列模式 可用于用户的 visit pattern.包括: 1.趋势分析 2.拐点检测 精品 模式分析 目的是根据实际应用,通过用户的选择和观察,把发现的规则、模式和统计规律转换为知识。 Visualization 精品 流数据挖掘 流数据简介 流数据频繁模式挖掘简介 流数据频繁模式挖掘算法 精品 数据流简介 概念 一系列连续且有序的点组成的序列 x1,…, xi, …, xn,称为数据流;按照固定的次序,这些点只能被读取一次或者几次 特点 大数据量,甚至无限 频繁的变化和快速的响应 线性扫描算法,查询次数有限 random access is expensive 精品 DBMS 与 DSMS 持久的关系 One-time queries 随机的访问 “无限”的磁盘空间 当前状态有效 相对较低的更新率 很少“实时服务” 假定数据精确无误 访问策略由查询处理器在数据库设计时确定 瞬间的流 连续的查询 序列化的访问 有限的主存 数据的到达顺序是关键 数据传输率未知 实时响应 过时/模糊的数据 变化的数据及数据量 精品 Scratch Space (Main memory and/or Disk) User/Application Continuous Query Stream Query Processor Results Multiple streams DSMS 精品 DSMS Scratch Store DSMS Input streams Register Query Streamed Result Stored Result Archive Stored Relations 精品 目前的DSMS项目 STREAM (Stanford): A general-purpose DSMS Cougar (Cornell): sensors Aurora (Brown/MIT): sensor monitoring, dataflow Hancock (ATT): telecom streams Niagara (OGI/Wisconsin): Internet XML databases OpenCQ (Georgia Tech): triggers, incr. view maintenance Tapestry (Xerox): pub/sub content-based filtering Telegraph (Berkeley): adaptive engine for sensors Tradebot (): stock tickers streams Tribeca (Bellcore): network monitoring Streaminer (UIUC): new proj

文档评论(0)

liuxiaoyu99 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档