- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
5.无法支持较精确的查询:目前在Web上使用者可以透过搜寻引擎(searchengine)所提供的关键词查询(keywordsearch)来寻找相关的信息,但由于目前Web上的信息不断增加,使得搜寻引擎的查询结果往往会找到太多的信息,而这些信息又不一定能符合自己的信息需求,往往使用者花在过滤出所需信息的时间,会超过真正去看这些信息的时间。搜寻引擎的准确率(precisionrate)不高是因为的所用的查询模式是对网页进行全文检索,虽然也可以将搜寻的目标限制在HTML文件的Title部分来提高准确率,但这样又会降低查询的回收率(recallrate)。一个较好的办法是提供可以指定内容(content-specific)的标签,例如:author庄子/author与title庄子/title便有所区分,如此一来查询时便可做较精确的限定,其效果有如字段化查询一般,不过HTML并无法让网页制作者自行定义可以指定内容语义的标签,XML将能解决这个问题。第29页,共46页,星期日,2025年,2月5日6.HTML的不断修订造成了许多网站维护的额外工作:由于HTML是一个演进中的标准,每当HTML的标签集不能满足需求时,W3C就会为HTML加入新的标签,推出新的HTML版本。从HTML2.0到HTML3.2,再到HTML4.0,每当新的HTML版本推出,一些必须维护大量HTML文件的单位就得重新回头检视这些旧版的HTML文件,看看有没有需要重新标示文件。除了W3C会以官方立场身分修订HTML外,浏览器大厂Microsoft以及Netscape也会伴随着新版的浏览器推出自己的HTML延伸标准,而两家厂商推出的延伸标准又不完全兼容,对于许多网站维护人员来说,每当有新版的浏览器问世,就代表着可能又要对部分的网页重新标示。有些组织为了彻底避免重新标示文件的困扰,干脆决定采用SGML来标示文件,再把SGML转换成HTML,因为将SGML转成HTML只要透过转换程序批次进行并不需花费大多资源,但若要重新标示成千上万的HTML网页就工程浩大了。第30页,共46页,星期日,2025年,2月5日4.4XML
???XML是W3C在1996年底提出的标准,它是从SGML衍生出来的简化格式,也是一种元语言(meta-language),可以用来定义任何一种新的标示语言。XML的制定是为了补足HTML的不完美,使得在Web上能够传输、处理各类复杂的文件,它去除了SGML复杂不常用及不利于在Web传送的选项功能,让使用者可以很容易地定义属于自己的文件型态,程序设计师也能在更短的时间开发XML相关应用程序。XML1.0Recommendation已于1998年2月公布,相关标准目前仍在发展之中,XML的发展获得了各界的支持,其中包括了SunMicrosystems,Microsoft,Netscape,Adobe,ArborText...等软件大厂的背书第31页,共46页,星期日,2025年,2月5日第32页,共46页,星期日,2025年,2月5日第33页,共46页,星期日,2025年,2月5日第1页,共46页,星期日,2025年,2月5日4.1SGML从信息组织的电子信息组织的发展来看,依发展的时间顺序介绍三种电子文件格式:标准通用标示语言(StandardGeneralizedMarkupLanguage;简称SGML)、超文件标示语言(HypertextMarkupLanguage;简称HTML)与最新崛起的可扩展标示语言(ExtensibleMarkupLanguage,简称XML)。第2页,共46页,星期日,2025年,2月5日SGML是ISO在1986年所颁布的国际标准(ISO8879),在电子图书馆相关计划中,目前有TEI(TextEncodingInitiative)、EAD(EncodedArchivalDescription)、CIMI(ConsortiumfortheInterchangeofMuseumInformation)、DIAP(DigitalImageAccessProject)与美国国会图书馆的AmericanMemoryProject等采用SGML作为文件格式。第3页,共46页,星期日,2025年,2月5日HTML是SGML的一个应用,是一种用以创造超文件(hypertext)的简易数据格式,目前在全球信息网(WorldWideWeb;简称WWW或Web)获得普遍的采用,是写作网页(webpages)的标准语言;XML是全球信息网联盟(WorldWideWebConsortium;简称W3C)在
原创力文档


文档评论(0)