面向数据流的频繁项集挖掘.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2015年 2月 洛阳师范学院学报 Feb..2015 第 34卷 第 2期 Journ~ ofLuoyangNorm~ Universi~ Vo1.34 No.2 面 向数据流的频繁项集挖掘 陈凤娟 (辽宁对外经贸学院基础课教研部,辽宁大连 116052) 摘 要:随着计算机网络、气象监测和传感器网络等技术的不断发展 ,如何从数据流中挖掘出有用的信息成为 了一个重要的研究内容.本文主要介绍了数据流和其中的频繁项集的概念,分析 了数据流中的频繁项集挖掘 算法. 关键词:数据流;频繁项集;倾斜时间窗口;频繁模式树 中图分类号:TP274 文献标识码:A 文章编号:1009—4970(2015)02—0082—04 数据,例如,Web上的用户点击信息、遥感传输的 0 引言 图像信息、实时电话记录信息、金融证券的实时交 数据挖掘是一门交叉学科,广泛应用于信息管 易信息、各种网络控制交换数据信息,以及传感器 理、过程控制、科学研究和决策支持等领域,能根 网络检测数据等.这些数据具有实时性,是一种动 据用户的具体模式需求,从大量的数据中挖掘有用 态的数据 ,这里把这种数据称为数据流.数据流是 的信息.数据挖掘可对数据库中存储的大量信息进 一 种数据序列,具有连续性、高速性、数据量无限 行分类、聚类和关联规则挖掘等操作,能给各种决 性和数据内容随时问改变等特征 . 策提供依据.但是随着网络技术、传感器技术和信 相对于用关系模型存储的静态数据集,数据流 息技术的发展,在各个应用领域中产生了大量的实 具有一些特殊的性质.首先 ,数据流巾的数据元素 时、连续、无限增长和有时间顺序的数据 (这些动 是按时间顺序排列,因此,系统在处理数据流的时 态的数据也被称为数据流),仅仅对静态的数据进 候 ,是不能改变数据元素的顺序的;其次,数据流 行分析和处理已经无法满足应用的需求.已有的针 的数据是无限的,是不断更新 的;最后 ,数据流的 对静态数据集的数据挖掘算法对于数据流数据的挖 元素被处理后,不容易再次访问,即数据流在处理 掘无能为力,所以我们必须对原有算法进行改进 . 时一般只能读取一次. 数据流在传感器网络、电信通话记录、气象监 对数据流进行研究主要从两个方面入手,分别 测与分析、股票分析、邮件过滤、网络监控与安全、 是数据流管理和数据流挖掘.数据流管理主要研究 Web 日志分析,以及大规模科学计算与数据分析等 数据流管理系统对数据流的管理和查询等功能;而 方面有重要的意义.数据流挖掘主要是通过分析数 数据流挖掘主要研究数据流的分析处理方法,特别 据流来寻找存在于数据流 中的关联规则、分类规 是对于数据流的在线处理分析,如数据流的分类、 则、聚类模式和异常模式等. 聚类、频繁项集挖掘以及可视化等.其中挖掘的算 本文主要研究数据流的频繁项集挖掘算法,首 法是核心,主要用在数据流聚类 、数据流分类、数 先介绍数据流与数据流挖掘中的基本概念,然后介 据流频繁模式挖掘、数据流时间序列和孤立点挖掘 绍频繁项集挖掘的基本概念,之后分析数据流的频 等方面. 繁项集挖掘算法的优缺点,最后提出改进算法. 按照数据流时序范围的不同,可以把数据流模

文档评论(0)

追云少女 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档