基于Web多媒体基础教育资源检索系统设计.docVIP

基于Web多媒体基础教育资源检索系统设计.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于Web多媒体基础教育资源检索系统设计

基于Web多媒体基础教育资源检索系统设计    摘 要:Internet蕴含了大量的教育资源,但因为缺乏行之有效的检索工具,造成了大量Web多媒体教育资源利用率低下的问题。本文设计并实现了一个Web多媒体基础教育资源的检索系统,用于搜索Internet上与基础教育有关的多媒体教育资源,并按资源的格式存储为不同的类型。    关键词: 多媒体资源;搜索策略;PageRank    中图分类号: G 434 文献标识码: A 文章编号:1673-8454(2008)02-0070-04       随着Internet的快速发展,Web中蕴含了大量的多媒体教育资源。多媒体资源(包括图像、声音、视频、动画等)作为Web中信息存在的主要形式,对教育领域有着越来越重要的作用。Web多媒体资源以其信息的开放性、资源的丰富性、时间空间的灵活性、形式的新颖性成为教育资源的重要组成部分,同时对建构主义学习环境的创建和学习者的学习具有非常重要的作用。但目前Web多媒体资源存在着资源分布不集中、学科界限模糊、存储格式多种多样、资源利用率低等问题。本文结合作者开发的主题搜索引擎系统的实际应用,对搜索条件进行限制,设计并实现了一个Web多媒体基础教育资源检索系统(EMS,Education Media Searching),介绍了如何检索和获取互联网上的多媒体基础教育资源。       一、多媒体资源       按照多媒体的类型可以将多媒体资源分为四大类:图形/图像类、音频类、视频类、动画类。[1]这些多媒体资源在Internet上以各种形式嵌入到网页当中,以不同的表现形式反映教育信息,成为教育资源的重要组成部分。Web多媒体教育资源是指以多媒体形式在网页上呈现的教育资源。在我国基础教育指:幼儿教育、义务教育和普通高中教育。[2]通过分析国家基础教育资源网(),将四类多媒体资源按格式分类(见表1)。[3]      二、多媒体资源在网页中的存在形式      多媒体资源在网页中的存在形式不外乎两种,一种是可以在线浏览的多媒体素材,即网页嵌入式;另一种是需要通过下载获得的多媒体素材,即超链接形式。[4]不同类型的多媒体素材在网页中存在的方式也不同,统计结果见表2。   网页作为信息的载体,格式有很多种,包括html, asp, php, jsp, xml等,但现在大多数采用超文本标记语言(HTML)编写,其内部表现为由离散文本条与标记组成的字符串序列。其中标记控制浏览器如何显示定义的信息、决定了嵌入的多媒体资源的类型以及呈现形式。   HTML文档标签大致分为两类:一类是传输数据的标签,如paragraph,table等,它们显示Web站点包含的信息;第二类是基础结构标签(infrastructuretags),这类标签指示浏览器如何从当前页面跳转到其他页面,常见的有<A>、<Area>和<Form>,这类标签需要提取。    由于最终要提取出包含多媒体素材(音频、图像、视频和动画)的页面,因此还需要提取包含这些多媒体素材的标签。在Web页面中,以超链接形式出现的多媒体素材包含在标签<A>中;嵌入到web页面中的多媒体素材包含在标签<object>和<embed>中,除此之外还要提取标签<Base>和<Frame>;各标签的作用如表3。   通过HTML解析器的分析,可以将多媒体标签中的多媒体信息提取出来,同时获取这些多媒的路径(相对路径或决定路径)。通过分析多媒体的扩展名,将多媒体按照不同的格式分到相应的类别中,如:image.jpg 属于图形/图像类、main.mov属于视频、bkpgztp.wmv属于音频、physic.swf属于动画。      三、多媒体教育资源检索系统(EMS)的实现过程      笔者将主题搜索引擎系统进行改进,设计并开发一个多媒体基础教育资源系统(EMS),用于提取网页中嵌入的与教育有关的多媒体资源。整个系统包括:搜索器、HTML解析器、素材分类器、存储器。    EMS系统融合了网络搜索引擎和多媒体教育资源网页的识别与提取技术。用户通过用户界面向搜索引擎发号搜索指令,搜索引擎以种子网页为起点,根据宽度优先的搜索策略,爬行种子网页所链接的所有网页;爬行过的网页通过HTML解析器提取网页中所嵌入的多媒体素材的路径信息,同时获取描述此网页的相关文本。为了确定采集到的多媒体属于教育资源的范畴,在素材分类器中,加入教育资源词典,用于分析采集的多媒体资源与教育信息的相关度;相关度的计算主要采用关键词加权求值方式进行;对于相关度大于一定阈值的网页,说明此网页中嵌入的多媒体属于教育资源,存储器按照相关度的高低将多媒体路径信息存储到数据库中。       四、Web多媒体教育资源检索的关

文档评论(0)

erterye + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档