基于Web的多媒体数据挖掘方法研讨.pdfVIP

下载本文档

1
0
约6.2千字
约 4页
2018-01-12 发布于广东
举报
版权申诉

基于Web的多媒体数据挖掘方法研讨.pdf

1、本文档共4页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于Web的多媒体数据挖掘方法研究吴静刘戌峰中南财经政法大学经济信息与管理系，武汉，430060 摘要基于Web的数据挖掘是当前热门的方向之一，本文提出了一个在Web环境下多媒体数据挖掘系统的一般结构，介绍了多媒体数据挖掘的流程。重点分析了几种挖掘方法(分类、聚类和相关分析)在多媒体挖掘中的应用，并且讨论了多媒体数据挖掘的立方体多维挖掘机制和关联规则挖掘机制。关键词Web，多媒体数据，多媒体数据挖掘 1 引言随着网上信息资源的急剧增加，用户对使用自动化工具来查找所期望的信息资源的要求越来越迫切。网络信息资源的类型众多，不仅涉及到新闻、广告、教育、电子商务等众多服务信息，丰富、动态的超文本信息，还有大量的声音、图像、视频以及动画等多媒体信息。由于网络电子出版物、数字图书馆等的不断增加，网络多媒体数据越来越快，对网络多媒体数据的挖掘分析已经受到越来越多人的关注。对文本的Web数据挖掘已经不能满足人们个性化服务的需要，所以对基于Web的多媒体数据挖掘就势在必行了。 2多媒体数据挖掘的系统结构多媒体数据挖掘系统主要由3部分组成：多媒体数据库(MultimediaDatabase，简写为 MD)，多媒体数据挖掘引擎(MultimediaMining a Interface，简称MMD)。多媒体数据挖掘过程图略。 Mining (1)多媒体数据特征的提取多媒体特征的提取是进行知识挖掘的基本前提。多媒体数据的查询和挖掘需要进行特征提取并分开放在特征数据库中。在检索过程中，检索子系统使用的是特征数据而不是数据库项目本身。因此，特征的提取质量是决定检索的有效性。如果某个特征没有从数据项目中提取出来，那么相应的查询就不可能检索到该数据项目。一般来说，多媒体包括三个层次的特征，即：元数据特征，文字注释特征和内容特征。而内容特征是最主要也最具代表性的特征，通过内容对对象进行搜索和检索主要依赖于对象内容的表示法，即选择的特征表示及使用的相似度标准。对于图像数据，主要提取纹理、颜色、形状和空间、运动等特征，对于音频数据，主要提取声强、频率、谐波结构、音调、音色、音量等特征。所需要的多媒体特征是基于希望的查询类型而提取的，并且通常是不完备的。特征由一组向量集表示，每个视觉特征具有相应的向量，如颜色、方向、颜色布局和边界布局等向量。 32 (2)多媒体数据的索引特征被提取出来之后，需要用一种索引结构去组织，以支持基于特征的相似性检索。多媒体特征数据库要求多维索引结构，必须具备伸缩性强，能达翻很高的维数，以支持不同角度的多媒体数据特征，而且还要能够支持任意相似性距离的查询，因此作为多媒体的索引仅引用一两个特征是不够的，应该选择多个适应不同环境的特征集和利用新的特征表示方法。 (3)多媒体数据库的建立多媒体数据库包括了媒体库、特征库和知识库。媒体库包含多媒体数据，如图像、视频、音频、文本；特征库包含用户输入的客观特征和预处理自动提取的内容特征；知识库包含领域知识和通用知识，其中的知识表达可以更换，以适应不同领域的应用要求。 (4)多媒体数据的挖掘过程多媒体数据的挖掘过程实际上是对获取的相关数据进行挖掘，从而发现有用的隐含知识。多媒体数据挖掘工作主要分为如下几个阶段： ①数据准备：在完成数据集成和特征库建立以后。将用户提出的挖掘要求送人挖掘引擎，用相似检索技术，从特征库抽取与用户要求相关的数据；接着用与请求相关的特征建立特征立方体。 ②媒体数据知识挖掘：根据用户要求，对多媒体特征库实施切片、切块、下钻、上旋等处理技术和数据挖掘方法，发现媒体特征问的关系、基于媒体特征的图像和视频的分类。可实施交互式或自动的知识挖掘，从而发现用户感兴趣的隐含知识。 ③知识表示与解释：将结果以图形界面呈现给用户，并加以解释和说明。若用户不满意，则从新执行上述操作，用户也可以通过挖掘出的数据再进行相关数据的检索。用户请求与挖掘结果表示用户请求方式，用户通过一个知识发现请求，启动一次多媒体数据挖掘过程。 ④挖掘结果表示方法：挖掘的知识必须是以可理解的方式呈现给用户，不同的知识用不同规则的表示方式。 (5)多媒体数据挖掘的方法对多媒体数据库的知识挖掘包括很多方面，主要的数据挖掘方法有分类、