- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
浅谈数据挖掘在多媒体和图书馆中应用
浅谈数据挖掘在多媒体和图书馆中应用
摘 要:随着信息技术的快速发展,数据挖掘技术在信息利用和提取中发挥日益重要的作用。本文简单探讨了数据挖掘在多媒体数据库中的应用,结合我院实际情况分析了数据挖掘在图书馆中的应用。
关键词:数据挖掘 多媒体挖掘技术 文本挖掘 Web挖掘
中图分类号:G25 文献标识码:A 文章编号:1672-3791(2011)12(a)-0255-02
1 数据挖掘
高职院校的建设正朝着自动化、数字化和信息化的方向发展,作为学院图文信息中心的一员,要走在知识社会的最前面,必须适应高科技、高技术的快速发展,一方面将我们具有传统优势的资源继续保持,一方面积极投入到高职院校数据挖掘工作中。
近年来,数据挖掘之所以引起信息化和数字化的极大关注并被广泛使用,最重要的原因在于它能存储大量的数据,同时可以将这些数据转换成有用的信息和知识。
1.1 数据挖掘的概念
什么是数据挖掘?有人说,数据挖掘是从大量数据中提取或“挖掘”知识。举例来说,从矿石或砂子挖掘黄金称作黄金挖掘,而不是砂石挖掘。这样一来,笔者以为挖掘是一个很生动的术语,应当更正确的命名为“从数据中挖掘知识”。
另有一部分人只是把数据挖掘视为数据库中知识发现过程的一个步骤。由以下七个步骤组成:数据清理、数据集成、数据选择、数据变换、数据挖掘、模式评估和知识表示。这种观点认为数据挖掘可以与用户或知识库交互。数据挖掘只是整个过程中最重要的一步,因为它发现隐藏的模式。
本文采用数据挖掘的广泛定义:数据挖掘是从存放在数据库、数据仓库或其他信息库中的大量数据中挖掘有趣知识的过程。
1.2 数据挖掘的优点
起初各种各样的数据存储在计算机的数据库中,然后发展到可以对数据库进行查询和访问,随后又可以实现即使遍历,所以人们对数据库技术的不断研究和开发使得数据库挖掘技术迈进了一个更高的台阶。它更能够找出以前数据之间的潜在联系,从而促进信息的传递。总而言之,数据挖掘是信息技术自然演化的结果。获取的信息和知识广泛的应用于科学探索、市场分析、商务管理和生产控制等等。
既然数据挖掘不仅可以发现多个数据库之间的数据规律,恰恰这些规律很难被简单的查询系统发现,而且它可以改进不同数据库之间的信息交换和互操作性。众所周知,Internet连接了许多数据源,形成了分布式的、庞大的和多样的数据库。因此,对数据挖掘工作提出了巨大的挑战。如何在大型的数据库系统中做好数据挖掘工作对研究者和开发者提出了更大的需求。
2 数据挖掘在多媒体数据库中的应用
由于互联网的流行和普及,音频视频设备的迅速发展,多媒体数据库系统变得日益常见。到底什么是多媒体数据库呢?多媒体数据库是指存储和管理大量多媒体对象的数据库,比如说图像数据、音频和视频数据、序列数据以及超文本数据和链接。
多媒体数据挖掘的方法有很多,本文就图像数据的挖掘进行简单探讨,包括多媒体数据的相似搜索,分类和预测分析以及多媒体数据的关联挖掘。
2.1 多媒体数据的相似性搜索
不少人提问对于多媒体数据库中的相似数据,是考虑基于数据描述还是基于数据内容呢?如何区分呢?对多媒体数据的相似搜索主要考虑两种多媒体标引和检索系统。
如关键字、标题、尺寸和创建时间等在图像描述之上建立标引和执行对象的检索可以考虑基于描述的检索系统;如颜色构成、形状、对象和小波变化等基于图像内容的检索往往考虑内容检索系统。这两种检索的利弊又是什么呢?举例来说,因为对图像赋予关键字是可以很灵活很随意的,不同的人有不同的选择,因此可以断定基于描述的检索如果手工完成非常费劲,如果自动完成,检索质量一般较差。在很多应用中通常都需要采用基于内容的检索系统,使用视觉的特征标引图像并基于特征相似检索对象。
2.2 多媒体数据的分类和预测分析
目前尤其在科学研究中,大多采用分类和预测分析进行多媒体数据挖掘,比如在天文学和地理学的研究。天文学家认真分类过的天空图像,根据如大小、面积、密度、图像要素和方位等特性构造出模型。这些模型不仅可以用于识别星系、星星以及其他恒星体,而且在模型基础上利用望远镜和太空探测器收集大量的图像进行处理,从而发现新的天体。我国已经成功的运用这一方法去识别金星上的火山。
在图像数据挖掘应用中采用的最基本的数据挖掘方法就是决策树分类。当然了,在图像数据挖掘中还有相当重要的一个环节就是数据预处理。它包括数据清洗,数据聚焦和特征提取。由于图像数据量相当大,因此需要很强的处理能力。所以说,图像分析技术和科学数据分析方法非常适用于图像数据的挖掘过程。
在多媒体数据中的特别是图像和视频数据库中,要挖掘设计多媒体对象间的关联规则,通常采用的方法是我们把
您可能关注的文档
最近下载
- 2025年中国人民抗日战争胜利80周年铭记历史吾辈自强主题党课PPT.pptx VIP
- 承台土方开挖施工方案.pdf VIP
- 人教版(2019)必修第一册 Unit 3 sports and fitness Reading for Writing 导学案(含答案).docx VIP
- 施工总体进度计划及保障措施.doc VIP
- 《四年级上册语文第四单元复习》课件.pptx VIP
- 重庆独立储能电站项目可行性研究报告.docx
- 《思想政治教育学原理》教学.ppt VIP
- 某楼盘项目首期开盘营销工作倒排计划.xlsx VIP
- 2022人教版四年级上册数学期中测试卷含答案(基础题).docx VIP
- 《尿石症的诊断和治疗(2025EAU指南)》解读PPT课件.pptx VIP
原创力文档


文档评论(0)