- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于资源分类信息树教育资源元数据分布式存储
基于资源分类信息树教育资源元数据分布式存储【摘要】在教育资源大规模应用系统中,除了资源数据存储外,资源元数据信息的更新、获取也会成为系统的瓶颈。我们提出了一种利用资源分类信息树来辅助教育资源元数据分布式存储的策略,并就其各种操作进行了研究。该策略除拥有集中式存储的资源查全、查准特性外,还拥有灵活的扩展性,能应对大规模用户访问。
【关键词】元数据;资源分类信息树;分布式存储
【中图分类号】G420 【文献标识码】B【论文编号】1009―8097(2010)04―0108―04
一 引言
在有大规模用户参与的教育资源建设和地区级有组织的教育资源共建共享项目中,教育资源存储都采取了服务器集群、分布式存储等方式,以应对用户上传下载。但一般资源元数据信息都采取集中存储的方式[2][3][4],在用户规模不断扩大的情况下,元数据信息的访问将成为系统瓶颈。因此我们研究了一种利用资源分类信息树来辅助教育资源元数据分布式存储的策略,且不失集中存储所具有的资源查全、查准特性。同时我们认为,教育资源本身的分类特性以及教育资源用户兴趣偏好的明显存在,也支持元数据的分布式存储。
二 资源分类信息树
全国信息技术标准化技术委员会教育技术分技术委员会(http://www.celtsc.省略/)制定的《教育资源建设技术规范》中,利用学科、实用对象、素材类型三种基本分类方法产生了六种分类体系,根据在实践中教师偏好,我们选择了图1的分类体系作为基础:
考虑教材版本对资源内容和用户的影响,我们将教材版本作为一种基本分类,同时为每一种分类增加一种名为“其他”的类别,以用于容纳在该分类下无明确类别的资源,如一张图片,它可能没有教材版本的区别。这样扩展为如图2的形式。
这里我们对分布式系统中典型的两类节点的定义如下:
教育资源元数据节点:为教育资源某种(些)分类下的教育资源元数据提供存储、查询等服务。在一个分布式系统中,教育资源元数据节点可根据需要增加。
教师节点:最主要的资源用户,他们可能是通过普通浏览器或通过专有客户端访问教育资源。
1 资源分类信息树的定义
参照一般数据结构教科书中对树的定义,资源分类信息树定义如下:资源分类信息树是包含有n个结点的有限集合,在这个集合上定义了一个唯一的关系,它满足下列条件:
(1) 集合中存在唯一的一个结点,它没有前驱,称为树的根,这里命名为“教育资源”;
(2) 除根以外,集合中的每个结点都有且仅有一个前驱;
(3) 除根以外,集合中的任何一个结点a,都存在唯一的一个从根到a的结点序列a0,a1,a2,am,其中,a0即树根,而am=a,在这个序列中,节点ai是ai-1(1≤i≤m)的后继。这个结点序列称为从根到a的路径;
(4) 每个结点表示教育资源某种分类下的具体分类,如按学科分类下的“语文”;
(5) 没有后继的结点称为叶结点,有且只有叶结点而且必须存储至少一条元数据节点信息,表示该类元数据信息由这些元数据节点存储。如果元数据节点信息超过一条,表示该类元数据信息有多个完全备份。
(6) 如果某种教育资源分类方法的某种类别在某结点直接后继中,那么该分类所有类别都必须出现在该结点的直接后继集合中。
通过扩展树的广义表表示法,可按照以下方式存储资源分类信息树:用中括号表示结点的后继,用小括号表示元数据节点信息。则上图可表示为:
“教育资源[语文[人教版[一年级(元数据节点A),二年级(元数据节点B,元数据节点C),六年级(元数据节点C)],苏教版(元数据节点D),师大版[小学(元数据节点F),初中(元数据节点G)]],政治(元数据节点E),地理(元数据节点E)]”
为了便于存储和传输,我们参考《教育资源建设技术规范》,对资源类别进行编码,其中元数据节点信息是一个HTTP地址,因此经过编码,图3中的资源分类信息树可进一步表示如下:
“EduRes [ GS001 [ T001 [ GO003 ( http://metaa.省略), GO004 ( http://metab.省略, http://metac.省略 ), GO008 ( http://metac.省略 ) ], T002 (http://metad.省略 ), T003 [ GOE001 (http://metaf.省略),GOE002 (http://metag.省略)]], GS005(http://metae.省略),GS007( http://metae.省略 ) ]”
同时,考虑资源分类信息树的动态性,我们为其设置了版本号和校验码,用“V”代表版本号,“RTree”代表编码后的资源分类信息树,那么校验码“CS”由如下公式
原创力文档


文档评论(0)