数据库中加权关联规则的发现.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据库中加权关联规则的发现.pdf

维普资讯 @2001JournalD Software 软 件 学 报 数据库 中加权关联规则的发现 欧陌寿民,部 诚 .莽废圭。 (安徽大学 计算 中心,妻徽 台肥 230039)i (安徽大学 计算机系,妻徽 台肥 230039); a(中 国科 学技术 大学 计算机科 学技术 系 ,安徽 台肥 330027) E—mail:oywm@lTlar$ahu.edu.cn http: /www ahu.edu.cn 摘要 :关联规则发现是敷据库 中知识发现研 究中的热点课题 ,有看广泛 的应 用领域 在现有 的研 究 中,数据库 中 的各十项 目是按 平等一致 的方式加 以处理 的.然而 ,在理 实世界数据库 中却并非如此 ,不 同的项 目拄往有看不 同 的重要性 曲了将 它们反映出采 ,时项 目引凡权值 、坡而提 出 了新 的加 权关联规 l问题 由于项 目权值 的引凡,颤 繁项 目集 的子集不再一 定是频繁 的.为此 ,又提 出了项 目的 ^一支持期望概 惫 ,并 由此提 出了加 权 关联规尉 的发现 算 法 . 芙犍词 :数据发掘 {知识发现 {加权 关联规 则 中图法分 类号 :TP311 文献标识码 :A 近年来 ,数据库 中的知识 发现 (knowledgediscovery,indatabases,简称 KDD),也称 数据 发掘 (datamining).受 到 当今 国际人 工 智能与数据库 界的广 泛重视一 关联 规则是 KDD研究 中的一个 重 要的研 究课题 .该 问题是 由R Agrawal等 人提 出的 ,目的是要在 交 易数据 库 中发现各项 目之 间 的关系 ’.例如 ,有这样一条关联规则 :黄油 ,牛奶 面包 (30 和 2 )其含义是购买 了黄油和牛 奶 的顾客还将 购买面包 ,3O%和 2%分别 是该规 则 的信任度 和支持度 .在 关联 规则发现研 究 中最著 名 的算 法是 R Agrawal等人提 出的 Apriori算法 该算法将 关联规 则 的发现分 为两步 .第 1步是识 别所 有 的频繁 项 目集 (frequentitemset),即其 支持不低 于用 户最 低支持 (minimum support)的项 目 集 第 2步是从频 繁集 中构造 其信任不低于用户最低信任 (minimum confidence)的规则.其他 太多 数算法都 是在该算 法 的基 础 上加 以改进或扩 展 的 ,基本 框架没有 变化 . 该算法实 际上存在 两太前提假设 :(1)数据库 中各项 目相 同的性质 和作用 .即重 要性相 同;(2) 数据库 中各项 目的分布是均匀 的 ,即 出现频率相 同或相似.也就是说 ,在该算法框架 下 ,数据库 中的 各个项 目以平 等一致 的方 式处理.然 而 ,在现实世 界数据 库 中却往往并非 如此.当数据库 中项 目分 布不均 匀 出现频 率相 差较 大时 ,就会 导致最低 支持设 高设低都有 问题的两难 局面 ,如果设高 了,所 发现 的关联 规则将 可能涉及不 到出现频率较低 的项 目;而若 设低 了,就会 发现太 多的杖有意义的甚 至是虚假 的关联规则 ,还 有可能导致组合爆炸 ,从而降低算法效率直至不可行 .近 年来 ,对 这一 问 题 ,国际上 已有若 干研究 工作 一J. 然而 ,对于前一个 问题 ,目前 国内外 尚未有相关文献.事 实上 ,不 同的项 目往往有着 不同的重 要 · 收辅 日期 :l999l206}修改 日期 :20∞ 0l2n 基 金项 目:国家 自热 科学 基金 资助 项 目 作者筒介 :欧 阳为 民 (1964一)·男 .五1被芜湖 ^.博士 .教授 ,主要研究领域为知识发现 机器学 习 .^ 智能及其应用 ;邦诚 1964一),男r安做 屯滇人 ,副教授 r主要研 究领域为知识发现 -机器学 习.^ 智能且其应用 ;蔡庆生 (1938一).男, 重庆人 教授 . 博士生 导师 ,主要研 究领域为机器学 习 知识盘现 .协调智能 维普资讯 政 阳为 民 等 :数据库

文档评论(0)

精品书屋 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档