- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于数据挖掘的文件元数据预取探究.doc
基于数据挖掘的文件元数据预取探究
【 摘 要 】 在文件存储系统中,文件系统整体性能的提升对于保证文件的安全性和可靠性具有重要意义,而在此过程中,元数据访问性能与文件系统性能有密切关系,要想进一步满足大规模文件存储系统需要,就必须建立相应的文件元数据预取模型。本文通过对基于数据挖掘的文件元数据预取进行分析,以期满足文件数据的大量存取访问需求。
【 关键词 】 数据挖掘;元数据;组预取
Based on Data Mining Exploration Prefetch File Metadata
Tang Yan-qun
( Information Center of Guizhou Economy and Information Technology Commission GuizhouGuiyang 550004)
【 Abstract 】 In the file storage system, improve the overall performance of the file system has to guarantee the reliability and security of documents is important, and in this process, metadata access and file system performance is closely related to performance, in order to further meet the large scale file storage systems need, we must establish the appropriate file metadata prefetching models. Based on the prefetch file-based data mining metadata analysis, in order to meet a lot of access to file data access needs.
【 Keywords 】 data mining; metadata; group prefetching
1 引言
近年来,随着科学技术的不断改革和进步,文件存储系统的性能不断优化,对于满足访问需求起到了较大的帮助作用。但在传统的文件存储系统中,元数据与数据本身是属于同一个文件系统的,在同一个存储设备上保存着,这样,随着访问量的增加,势必会导致文件访问并行性收到影响。对此,通过数据挖掘建立相应的文件元数据预取模型至关重要。
2 元数据访问概述
元数据一词较为常见,通常理解为关于数据的数据,其在数据库管理系统中充分发挥了自身功能,元数据尺寸较小,但其能够存储巨大的数量,对于优化数据库性能具有重要意义。元数据访问中主要包括缓存技术,主要用于降低文件操作率,对于访问过的元数据能够暂时保留,以尽量降低访问延迟时间,但此种技术的应用会受到元数据频繁更新的影响,如果缓存空间较小,更新算法效果较差,从而导致缓存技术的系统性能改善不够显著,最终影响到元数据访问。协作式缓存技术,网络速度的不断提升,使得协作式缓存技术的应用越来越频繁,通过对此种技术的应用,可以充分利用元数据服务系统中的空闲内存,从而形成虚拟的内存空间,以实现对元数据的缓存处理,这样不仅能够减少磁盘操作次数,同时还能够提升元数据访问效率,实现性能改善。
3 元数据访问流程
元数据在文件系统中占据重要地位,能够为文件系统提供整体的、系统的元数据服务,而通过元数据的应用,能够记录各种文件的详细信息,从最初在客户端搜索元数据信息,到最后在协作式缓存中返回,并与本地磁盘相联系,从而实现元数据系统整体性能的提升。
4 数据挖掘概述
数据挖掘主要是指对数据库中的已有数据进行分析,并与现有问题进行对比评估,以解决现有问题。换一种说法,数据挖掘也就是发现数据模式的过程,而这个过程的实现通常是自动化或者半自动化的,最为常见的是半自动化,而通过挖掘得出的规则能够得出经济优势。当前,科学技术的广泛应用对于数据挖掘的研究更加广泛,种类也越来越多,而根据挖掘对象可以分为空间数据、时间序列数据、多媒体数据及文本数据等。
5 基于数据挖掘的文件元数据预取模型
通过成组预取元数据,能够有效降低访问延迟,如果预取组包含了即将被访问的元数据,则能够在一定程度上提升Cache的命中率。在实施数据挖掘之前,应当先将不同的元数据请求联系起来,对应的元数据形成一个模型树,然后对于元数据中的各个文件信息进行序列分组处理,当出现新的元数据请求时,要用其代替原有的旧数据源请求
您可能关注的文档
- 基于声韵拼接的中文孤立词语音识别方法的研究.doc
- 基于外包的流程型生产订单选择问题研究.doc
- 基于多Agent的煤矿机电设备监测与诊断系统的研究.doc
- 基于多元智能理论的网络教育游戏设计与开发.doc
- 基于多媒体技术的现代初中语文教学策略.doc
- 基于多媒体网络技术的电力信息发布管控系统设计.doc
- 基于多感官协同疲劳驾驶预警方案的研究.doc
- 基于多特征的粒子滤波跟踪算法.doc
- 基于多种网络技术的区域照明监控系统的设计.doc
- 基于多要素联动模型的黑龙江省物联网产业创新系统研究.doc
- 场地脚手架工程施工方案(3篇).docx
- 2024年浙江省丽水市松阳县玉岩镇招聘社区工作者真题及参考答案详解一套.docx
- 2024年河南省郑州市惠济区古荥镇招聘社区工作者真题及答案详解一套.docx
- 2024年浙江省杭州市淳安县文昌镇招聘社区工作者真题及完整答案详解1套.docx
- 2024年浙江省台州市三门县小雄镇招聘社区工作者真题带答案详解.docx
- 2024年浙江省宁波市余姚市河姆渡镇招聘社区工作者真题及完整答案详解1套.docx
- 2024年浙江省丽水市景宁畲族自治县雁溪乡招聘社区工作者真题及答案详解一套.docx
- 2024年浙江省杭州市临安市板桥乡招聘社区工作者真题及答案详解一套.docx
- 2024年湖北省宜昌市点军区土城乡招聘社区工作者真题及答案详解一套.docx
- 2024年浙江省台州市路桥区桐屿街道招聘社区工作者真题附答案详解.docx
最近下载
- 煤矿一通三防PPT课件.pptx VIP
- 误吸预防与护理课件(1).pptx VIP
- 深圳清华实验学校语文新初一分班试卷.doc VIP
- 系列电动缸内容简介2特点规格产品手册18942et.pdf VIP
- 风湿免疫学课件.pptx VIP
- JVC摄像机EX-A10UF用户手册.pdf
- 高中数学 第一章 常用逻辑用语 1.3 充分条件、必要条件与命题的四种形式 1.3.1 推出与充分条件、必要条件课件 新人教B版选修1-1课件.ppt VIP
- 深圳清华实验学校新初一分班语文试卷.doc VIP
- 心肺复苏操作培训课件.ppt VIP
- 2025年高考复习之小题狂练(语言文字运用):语用2(30题).doc VIP
文档评论(0)