- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
一种基于XQuery应用的XML数据加权关联关系挖掘方法.pdf
计算机与数字工程 第35卷
一种基于xQuery应用的xML数据加权
关联关系挖掘方法+
邱长春1剖 薛超英21
(湖北教育学院计算机科学系‘’武汉430205)(武汉大学计算机学院2’武汉430072)
摘要根据加权关联关系挖掘模型和算法,提出一种基于xQu唧应用的xML数据加权关联关系的挖捌方法。
关键词 xML 数据挖掘
xQuefy加权关联关系
中图分类号TP3ll
定义1关联规则形如xjY的加权支持为:
1
(1)
亡(。赢nq)(8“ppon(xuY)’
由于Intemel的迅速发展及普及,产生了海量
这里k为x和Y的交易总数。
的、以致于泛滥的数据。在这些数据中,不仅数据
定义2设k一项目集的加权支持不低于最低
的表现形式多种多样,如有结构化的数据、半结构
加权支持阀值w—minsup,则这个k一项目集被称为
化的数据甚至非结构化的数据;而且数据之I刈的关
系变得越来越复杂,造成数据丰富而知识缺乏的现 频繁项目集,即
,1 、
状。如何有效地、快速地从海量的数据里面提取有
用的信息,如何更方便地传递、交流和获取信息,成
(2)
为当前数据挖掘领域的重点。关联规则是数据挖
定义3关联规则x号Y是令人感兴趣的,如果
掘领域的一个重要方面。
xuY是频繁项目集,并且其信任度不低于最低信
近几年,xML作为基于web的描述数据、交换
任阈值min_coI】f。
数据标准,正日益流行和普及,因此从web的大量
2.2加权关联的发现
数据中挖掘xML数据变得日益重要。国外不少文
2.2.1k一支持期望
献提出了从xML数据中抽取关联关系的方法,这
给定一个交易数据库,其交易总数设为T。对
些方法有的需要预先对数据进行必要对预处理和
count)为交
任一k一项目集x,其支持数(support
后处理,例如把xML数据格式转换成关系模式等,
易数据库中包含X的交易的个数,记为sc(x)。
然后进行挖掘;有的在挖掘时把数据平等看待,没
如果某k一项目集x是频繁的,那么其支持数sc
有考虑数据的重要程度。本文根据文献【4】提出
(x)应满足下式:
的带权重项的关联关系挖掘模型,应用xML查询
语言xQuery,在不需要对数据
文档评论(0)