- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据库中加权关联规则的发现.pdf
维普资讯
@2001JournalD Software 软 件 学 报
数据库 中加权关联规则的发现
欧陌寿民,部 诚 .莽废圭。
(安徽大学 计算 中心,妻徽 台肥 230039)i
(安徽大学 计算机系,妻徽 台肥 230039);
a(中 国科 学技术 大学 计算机科 学技术 系 ,安徽 台肥 330027)
E—mail:oywm@lTlar$ahu.edu.cn
http: /www ahu.edu.cn
摘要 :关联规则发现是敷据库 中知识发现研 究中的热点课题 ,有看广泛 的应 用领域 在现有 的研 究 中,数据库 中
的各十项 目是按 平等一致 的方式加 以处理 的.然而 ,在理 实世界数据库 中却并非如此 ,不 同的项 目拄往有看不 同
的重要性 曲了将 它们反映出采 ,时项 目引凡权值 、坡而提 出 了新 的加 权关联规 l问题 由于项 目权值 的引凡,颤
繁项 目集 的子集不再一 定是频繁 的.为此 ,又提 出了项 目的 ^一支持期望概 惫 ,并 由此提 出了加 权 关联规尉 的发现
算 法 .
芙犍词 :数据发掘 {知识发现 {加权 关联规 则
中图法分 类号 :TP311 文献标识码 :A
近年来 ,数据库 中的知识 发现 (knowledgediscovery,indatabases,简称 KDD),也称 数据 发掘
(datamining).受 到 当今 国际人 工 智能与数据库 界的广 泛重视一 关联 规则是 KDD研究 中的一个
重 要的研 究课题 .该 问题是 由R Agrawal等 人提 出的 ,目的是要在 交 易数据 库 中发现各项 目之 间
的关系 ’.例如 ,有这样一条关联规则 :黄油 ,牛奶 面包 (30 和 2 )其含义是购买 了黄油和牛
奶 的顾客还将 购买面包 ,3O%和 2%分别 是该规 则 的信任度 和支持度 .在 关联 规则发现研 究 中最著
名 的算 法是 R Agrawal等人提 出的 Apriori算法 该算法将 关联规 则 的发现分 为两步 .第 1步是识
别所 有 的频繁 项 目集 (frequentitemset),即其 支持不低 于用 户最 低支持 (minimum support)的项 目
集 第 2步是从频 繁集 中构造 其信任不低于用户最低信任 (minimum confidence)的规则.其他 太多
数算法都 是在该算 法 的基 础 上加 以改进或扩 展 的 ,基本 框架没有 变化 .
该算法实 际上存在 两太前提假设 :(1)数据库 中各项 目相 同的性质 和作用 .即重 要性相 同;(2)
数据库 中各项 目的分布是均匀 的 ,即 出现频率相 同或相似.也就是说 ,在该算法框架 下 ,数据库 中的
各个项 目以平 等一致 的方 式处理.然 而 ,在现实世 界数据 库 中却往往并非 如此.当数据库 中项 目分
布不均 匀 出现频 率相 差较 大时 ,就会 导致最低 支持设 高设低都有 问题的两难 局面 ,如果设高 了,所
发现 的关联 规则将 可能涉及不 到出现频率较低 的项 目;而若 设低 了,就会 发现太 多的杖有意义的甚
至是虚假 的关联规则 ,还 有可能导致组合爆炸 ,从而降低算法效率直至不可行 .近 年来 ,对 这一 问
题 ,国际上 已有若 干研究 工作 一J.
然而 ,对于前一个 问题 ,目前 国内外 尚未有相关文献.事 实上 ,不 同的项 目往往有着 不同的重 要
· 收辅 日期 :l999l206}修改 日期 :20∞ 0l2n
基 金项 目:国家 自热 科学 基金 资助 项 目
作者筒介 :欧 阳为 民 (1964一)·男 .五1被芜湖 ^.博士 .教授 ,主要研究领域为知识发现 机器学 习 .^ 智能及其应用 ;邦诚
1964一),男r安做 屯滇人 ,副教授 r主要研 究领域为知识发现 -机器学 习.^ 智能且其应用 ;蔡庆生 (1938一).男, 重庆人 教授 .
博士生 导师 ,主要研 究领域为机器学 习 知识盘现 .协调智能
维普资讯
政 阳为 民 等 :数据库
您可能关注的文档
最近下载
- 非煤矿山井巷工程施工组织设计标准 GB/T 51300-2018.docx VIP
- 体操理论课专用课件.ppt VIP
- 中职英语(高教版)教案:Unit1-Festivals-around-the-world(全6课时).pdf VIP
- 房屋建筑工程常用模板及支撑安装标准图集.pdf VIP
- 2 中国人首次进入自己的空间站(教学设计)-2025-2026学年八年级语文上册同步公开课精品讲堂(统编版2024).docx VIP
- 《艺术与审美》教学教案.docx
- 分红保险知识问答.doc VIP
- 热控检修规程(最终版).doc VIP
- 湖南大学《遗传学》课件-Chapter2Mitosis and Meiosis.pptx VIP
- 25年-《背诵宝典》-中级-会计实务.pdf VIP
文档评论(0)