基于数据挖掘的文件元数据预取探究.docVIP

基于数据挖掘的文件元数据预取探究.doc

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于数据挖掘的文件元数据预取探究.doc

基于数据挖掘的文件元数据预取探究   【 摘 要 】 在文件存储系统中,文件系统整体性能的提升对于保证文件的安全性和可靠性具有重要意义,而在此过程中,元数据访问性能与文件系统性能有密切关系,要想进一步满足大规模文件存储系统需要,就必须建立相应的文件元数据预取模型。本文通过对基于数据挖掘的文件元数据预取进行分析,以期满足文件数据的大量存取访问需求。   【 关键词 】 数据挖掘;元数据;组预取   Based on Data Mining Exploration Prefetch File Metadata   Tang Yan-qun   ( Information Center of Guizhou Economy and Information Technology Commission GuizhouGuiyang 550004)   【 Abstract 】 In the file storage system, improve the overall performance of the file system has to guarantee the reliability and security of documents is important, and in this process, metadata access and file system performance is closely related to performance, in order to further meet the large scale file storage systems need, we must establish the appropriate file metadata prefetching models. Based on the prefetch file-based data mining metadata analysis, in order to meet a lot of access to file data access needs.   【 Keywords 】 data mining; metadata; group prefetching   1 引言   近年来,随着科学技术的不断改革和进步,文件存储系统的性能不断优化,对于满足访问需求起到了较大的帮助作用。但在传统的文件存储系统中,元数据与数据本身是属于同一个文件系统的,在同一个存储设备上保存着,这样,随着访问量的增加,势必会导致文件访问并行性收到影响。对此,通过数据挖掘建立相应的文件元数据预取模型至关重要。   2 元数据访问概述   元数据一词较为常见,通常理解为关于数据的数据,其在数据库管理系统中充分发挥了自身功能,元数据尺寸较小,但其能够存储巨大的数量,对于优化数据库性能具有重要意义。元数据访问中主要包括缓存技术,主要用于降低文件操作率,对于访问过的元数据能够暂时保留,以尽量降低访问延迟时间,但此种技术的应用会受到元数据频繁更新的影响,如果缓存空间较小,更新算法效果较差,从而导致缓存技术的系统性能改善不够显著,最终影响到元数据访问。协作式缓存技术,网络速度的不断提升,使得协作式缓存技术的应用越来越频繁,通过对此种技术的应用,可以充分利用元数据服务系统中的空闲内存,从而形成虚拟的内存空间,以实现对元数据的缓存处理,这样不仅能够减少磁盘操作次数,同时还能够提升元数据访问效率,实现性能改善。   3 元数据访问流程   元数据在文件系统中占据重要地位,能够为文件系统提供整体的、系统的元数据服务,而通过元数据的应用,能够记录各种文件的详细信息,从最初在客户端搜索元数据信息,到最后在协作式缓存中返回,并与本地磁盘相联系,从而实现元数据系统整体性能的提升。   4 数据挖掘概述   数据挖掘主要是指对数据库中的已有数据进行分析,并与现有问题进行对比评估,以解决现有问题。换一种说法,数据挖掘也就是发现数据模式的过程,而这个过程的实现通常是自动化或者半自动化的,最为常见的是半自动化,而通过挖掘得出的规则能够得出经济优势。当前,科学技术的广泛应用对于数据挖掘的研究更加广泛,种类也越来越多,而根据挖掘对象可以分为空间数据、时间序列数据、多媒体数据及文本数据等。   5 基于数据挖掘的文件元数据预取模型   通过成组预取元数据,能够有效降低访问延迟,如果预取组包含了即将被访问的元数据,则能够在一定程度上提升Cache的命中率。在实施数据挖掘之前,应当先将不同的元数据请求联系起来,对应的元数据形成一个模型树,然后对于元数据中的各个文件信息进行序列分组处理,当出现新的元数据请求时,要用其代替原有的旧数据源请求

您可能关注的文档

文档评论(0)

lmother_lt + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档