- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
图像数据库关联规则挖掘方法研究
图像数据库关联规则挖掘方法研究
摘要:在多媒体应用中,图像数据库的使用日趋广泛,为了更有效地使用图像数据库,许多数据挖掘技术被用于图像数据库中。本文使用数据挖掘中的关联规则方法来进一步提高图像数据库的性能,基于此构建了一个图像数据库系统,在这个系统中使用了FP增长算法挖掘图像数据的关联规则。
关键词:图像数据库 数据挖掘 FP增长算法
中图分类号:TP301 文献标识码:A 文章编号:1007-9416(2012)10-0083-02
1、引言
随着计算机网络的发达及多媒体应用的日益广泛,各种图像、音频、视频数据在信息交互中成为出现最多的信息载体,尤其是图像信息,能使用直观的画面呈现出丰富的信息。然而在庞大的图像数据库中查找出相关数据,将图像画面内容与非图像内容特征建立联系,是高效使用图像数据的保障。近年来,为了提高图像数据库的性能,数据挖掘技术被应用到图像数据库中。本文使用数据挖掘中的关联规则方法来进一步提高图像数据库的性能,并基于此构建了一个图像数据库系统,在这个系统中使用了FP增长算法挖掘图像数据的关联规则。
2、图像数据库中的关联
数据挖掘是知识发现过程的一个步骤,从存放在数据库、数据仓库或其他信息库中的大量数据中发现有用的知识的过程[1]。面对图像数据库里庞大的数据量,如何高效地查询出有用的数据,简单的字段匹配方法无法应用于图像数据的匹配,无法作出是否关联的判断。而数据挖掘技术能通过相应的方法将图像数据的特征与存储的数据联系在一起,挖掘出两者的关联规则。因此,使用数据挖掘技术能有效找出图像数据的关联规则,从而查询出有用图像数据。
数据的关联主要关注的是满足最小支持度阈值和最小置信度阈值的关联规则。图像数据与一般的数据相比,其特征都是包含在图片信息中,因此,在图像数据库中可以挖掘涉及多媒体对象的关联规则,至少要包含以下三类:
第一,图像内容和非图像内容特征间的关联。图像内容是图片上体现的具体内容,而非图像内容特征则是对具体内容的描述或分类的描述。在进行图像搜索等处理过程中需要把这两者建立有效的关联???
第二,与空间联系无关的图像内容间的关联。此关联考虑的都是图像内容。
第三,与空间联系有关的图像内容间的关联。此关联把图像中的对象与空间联系关联在一起。
3、基于图像数据的FP增长算法
FP增长算法是可以避免重复地扫描数据库,不使用候选集,采取分治的策略,直接压缩数据库成一个频繁模式树,但仍保留项集关联信息。然后将压缩后的数据库划分成一组条件数据库,每个关联一个频繁项,并分别挖掘每个条件数据库,最后生成关联规则[2]。
首先将每个图像数据的属性设计为图像内容项、非图像内容项描述。其中图像内容项描述包括与空间联系有关的图像内容项和与空间联系无关的图像内容项。其次,完成图像数据的输入和存储操作,形成图像数据库D;一副图像用Ts表示,一个属性项用item_name表示;设最小支持度阈值为min_sup1,具体算法步骤如下:
步骤1:按以下步骤构造FP树:
(a)扫描图像数据库D一次。收集频繁项的集合F和它们的支持度计数。对F按支持度计数降序排序,结果为频繁项列表L。例如:图像内容项里有50%为蓝色而非图像内容特征描述为“天空”,则只要满足这种关联的图像作为一次计数。
(b)创建FP树的根节点,以“null”标记。对于D中的每个数据Ts(即一副图像),执行:选择Ts中的频繁项,并按L中的次序排序。设排序后的Ts中频繁项列表为[p|P],其中,p是第一个元素,而P是剩余元素列表。调用insert_tree([p|P],T)。该过程执行情况如下:如果T有一个子女N使得N.item_name=p.item_name,则N的计数增加1;否则创建一个新节点N,将其计数设置为1,链接到它的父节点T,并且通过节点链结构将其链接到具有相同item_name的节点。如果P非空,递归地调用insert_tree(P,N)。
步骤2:FP树的挖掘通过调用FP_growth(FP_tree,null)实现。该过程实现如下:
procedure FP_growth(Tree,α)
(1) if Tree含单个路径P then
(2) for each路径P中节点的每个组合(记作β)
(3) 产生模式β∪α,其支持度计数support_count等于β中节点的最小支持度计数;
(4) else for Tree的头表中的每个ai{
(5) 产生模式β=ai∪α,其支持度计数support_count=ai. support_count;
(6) 构造β的条件模式基,然后构造β的条件FP树Treeβ;
(7) if Treeβ≠? then
(8)
您可能关注的文档
最近下载
- 江苏省宿迁市宿豫区关庙镇初级中学九年级数学下册7.2 正弦、余弦(第1课时)教案 (新版)苏科版.doc VIP
- 沉井与顶管安全专项施工方案.doc VIP
- 客户拜访记录管理制度.docx VIP
- 有关时间的成语.doc VIP
- NBT 32027-2016 光伏发电工程设计概算编制规定及费用标准.pdf VIP
- 消化内科学(医学高级):消化内科学诊断学基础试题预测.docx VIP
- 描写景物的成语.docx VIP
- 人教版高中数学选择性必修一全套教材例题课后习题变式及答案解析.pdf VIP
- 趣味成语.ppt VIP
- (北师大2019版)英语必修第一册 Unit 1 大单元教学设计.docx
文档评论(0)