- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
CBR在因特网教育资源检索中的应用_计算机网络论文.doc
CBR在因特网教育资源检索中的应用_计算机网络论文
CBR在因特网教育资源检索中的应用_计算机网络论文
摘要 对因特网教育资源的检索日益受到关注,而目前基于关键词的检索方法效率不高,特别是对多媒体资源的检索显得相形见绌,人们迫切需要一种对因特网教育资源,尤其是多媒体教育资源更为有效的检索方法。基于内容的检索CBR(Content-BasedRetrieval)应运而生。它的出现将对提高因特网教育资源检索的质量和效率起到积极作用。
关键词 内容;多媒体;检索;因特网;教育资源.
AbsractBecausetherapiddevelopmentoftheInternethasresultedinincreasingamountofeducationalresource,especiallyinmultimediaforms,themethodsofretrievalbasedonkeywordsarenotsatisfying.PeopleneedmoreefficientmethodsofeducationalresourceretrievalintheInternet.Content-BasedRetrieval(CBR)isanefforttohandlethiseducationalresourceexplosionproblem.ThispaperpresentsasurveyofcurrentmethodsofresourceretrievalintheInternet,thenintroducestheapplicationofCBRineducationalresourceretrievalintheInternetanditsgreatvalue.
Keywords:contentmultimediaretrievaltheInterneteducationalresource.
一、目前因特网教育资源检索的局限性
目前对因特网教育资源的检索方法可分为三类:主题目录(subjectdirectory)、搜索引擎(searchengine)、元搜索引擎(metasearchengine)。主题目录由人工收集、编排,虽然检索结果更人性化,但效率低、周期长,无法适应因特网资源庞大、变化快的特点。搜索引擎又分为自动搜索(auto-retrieval)和全文检索(fulltextretrieval)。自动搜索依靠蜘蛛(Spider)、爬虫(Webcrawler)等搜索工具自动完成,效率高、更新快,但Spider不能访问Cookie、JavaScript或Java技术制作的网页,建立包容所有因特网资源的数据库也不现实,且搜索结果往往不切题。全文检索以文本信息为检索对象,建立全文数据库,可以高效检索海量非结构化数据,但不能有效过滤不相关内容。元搜索引擎让用户同时搜索若干数据库和搜索引擎,相对于单一搜索引擎它能查找到更多的资源,但由于必须兼顾不同搜索引擎,采用的是简单直接的搜索策略,反而失去了每个搜索引擎自身的特色。总之,现有一般检索方法均是基于关键词的检索,由于关键词标引工作量大,而标引同用户的检索概念常常不一致,导致查准率和查全率低。目前最好的搜索引擎其全球网页覆盖率还不到五成。虽然因特网这个世界最大的信息资源库为我们提供了极为丰富的教育资源,但现有的检索方法并没有使我们能有效地加以利用,我们常常感?quot生活在信息的海洋中,却忍受着知识的饥渴。
未来因特网的发展使这种检索方法的局限性日益凸现。首先,因特网海量数据的产生。因特网每天新添150万个文件,8个月增长1倍,其网页遍及全球300万个服务器,总数将由1997年2月的3.2亿猛增至2002年的80亿。利用现有的检索技术要在这以指数形式不断增长的资源数据库中提取所需如同大海捞针。其次,非结构化数据大量涌现。因特网的资源可分为结构化数据和非结构化数据。结构化数据能用数据或统一的结构加以表示,如数字、符号等。非结构化数据则不能,如图像、声音、视频等。这类数据的特征,如图像中的颜色、纹理,视频中的镜头、场景,声音中的音调、音色等虽可赋予名字、文件格式、采样率等属性,但其中没有可确认的词或可比较的实体,不能像文本那样搜索其内容,因此很难用现有基于关键词的检索方法检索。当然可以人工输入其属性和描述来弥补,但随着数据量的增大人工注释的强度也将加大。而且,人对非结构化数据的感知,如音乐的旋律很难付诸文字。第三,新一代高速因特网的出现对基于内容的多媒体信息检索提出了迫切要求。1996年美国启动的NGI(NextGenerationInternet)计划目标是实现端到端的传送速率比目前的Internet快成百至上千倍,可达到100Mbps至1Gbps,实现大量交互式多媒体
您可能关注的文档
- (信息化教育电子绩效支持系统ITEEPSS)的设计与实现_计算机论文.doc
- .Net平台下并行工程项目规划与团队组织系统的设计与实现_计算机论文.doc
- 08-16SP4MF型捣固车操作概述_电子机械论文.doc
- 10t半沸腾锅炉烟尘高效处理技术_工程建筑论文.doc
- 1992lxm工业蒸汽锅炉的自动化控制过程与实现_工程建筑论文.doc
- 2011年中国企业计算需求展望虚拟化-客户端计算与云计算_计算机网络论文.doc
- 214线退化性多年冻土地区试验路设计_工程建筑论文.doc
- 21世纪中国医院信息化及其对策_计算机论文.doc
- 21世纪制冷空调行业绿色环保制冷剂的趋势与展望_工程建筑论文.doc
- 21世纪岩土工程发展展望_工程建筑论文.doc
最近下载
- 儿科门诊品管圈输液原因分析鱼骨图.pptx VIP
- 建筑师工作室课件2复习进程.ppt VIP
- 农副产品电子商务平台_需求规格说明书.doc VIP
- 电梯困人的应急预案.pptx VIP
- 锚杆技术规.doc VIP
- 2023版高三一轮总复习历史教材版教案:板块1 第4单元 第9讲 明至清中叶的经济与文化.doc VIP
- (台球厅)消防安全管理档案.pdf
- 2010年一级建造师水利水电工程考试真题及答案.doc VIP
- 佳能 IR ADV C3520 C3525 C3530 彩色复印机中文维修手册.pdf VIP
- 2023-2024学年上海市上海交通大学附属中学高一下学期期末考试物理试卷含详解.docx VIP
文档评论(0)