Web上的数据标准XML概述与语法.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
高级Web技术Web上的数据标准XML—概述与语法课程主要内容组织 请理清听课思路 WEB高级开发与应用技术概述 基于Web的应用程序概念及其演变 N层次架构,分布式对象(组件)技术概述 核心技术讲解 Web数据标准-XML的相关标准和应用 VRML X3D Web上的分布式虚拟环境 Application Web-J2EE J2EE概述 Servlet JSP EJB J2EE组件与API J2EE MVC模式与框架(struts,spring etc)Service Web – Web ServicesSemantic Web企业应用背景 E_Bussiness, EAI etc. 应用案例本次课程内容XML简介与起源XML的设计目的XML的特点XML1.0规范组成XML文档逻辑结构XML文档规则XML简介与起源XML是 Extensible Markup Language (可扩展标记语言)的简称,是一种元语言(定义其他语言的系统 )1996年, W3C(World Wide WebConsortium,互联网联合组织)为了克服HTML的局限性, 在SGML的基础上创建XML计算机产业界 的需求:开发简单而又可扩展的、结构化和半结构化信息文本表示机制HTML是SGML的一个应用,XML是SGML的一个子集, 并且已经成为Internet上事实的数据交换标准1998年2月推出第一个正式的XML1.0版本;目前XML已经以扩展巴科斯-诺尔范式 EBNF(Extended Backus-Naur Form notation)的形式正式定义了下来(XML 1.1 (Second Edition), W3C Recommendation, 16 August 2006 )/TR/2006/REC-xml11独立于平台的XML是为Web开发的, 这是它最具影响的地方.HTML的局限性可扩展性差HTML的标记集是固定的,即HTML语法是不可扩展的缺乏对信息含义的描述能力,信息检索效率低HTML是针对人机交流而设计的,标记几乎全都是用来设计网页的布局和外观的。检索信息时,需要对全部页面的所有内容扫描,并且检索质量往往极差夜夜我不觉晓苦苦绕世界找玩儿命好几天有用的知多少HTML的局限性搜索引擎简介分类目录式搜索引擎:早期的Yahoo全文搜索引擎:Google及百度等第二代商用搜索引擎元搜索引擎:WebCrawlerHTML的局限性搜索引擎简介搜索引擎的体系结构下载系统:网络蜘蛛(Spider),广度,深度优先分析系统:分词,PageRank索引系统:正排索引;倒排索引查询系统:检索模型 HTML的局限性搜索引擎简介 分词 基于字符串匹配 基于理解 基于统计 PageRank+ PR (Tn)/C (Tn) )PR (A ) = (1- d) + d (PR (T1)/C (T1) + PR (A ) :网页A 的PageRank 值;, Tn :网页A 的链入网页;T1, , T2, ,PR (T i) :网页T i 的PageRank 值( i= 1, 2,C (T i) :网页T i 的链出网页的数量( i= 1, 2,n) ; n) ;d :一个衰减因子, 0 d 1, 通常取值为0. 85。HTML的局限性搜索引擎简介索引系统正排索引倒排索引HTML的局限性搜索引擎简介查询系统搜索引擎的评价标准查全率(Recall)查准率(Precision)HTML的局限性搜索引擎简介垂直搜索引擎HTML的局限性搜索引擎简介智能搜索引擎?“这是Web 将以一种智能的方式为我们服务、为我们完成乏味任务的时代的开始。Web 和信息量的增长速度非常快,开发智能化的搜索系统是势在必行的。”— Medstory的创始人、首席执行官阿莱因HTML的局限性与应用程序的数据自动交换受限制服务器端在HTML中嵌入动态数据是非常困难的客户端应用程序也很难自动从HTML中获取所需的数据描述能力有限HTML语言不能描述矢量图形、数学公式、化学符号等特殊对象链接功能有限链路丢失后不能自动纠正 HTML不能维持文档间的任何历史和关系,因此如果页面的URL地址变化了,浏览这些页面时就会遇到烦人的404 URL地址未找到的信息。链接方式是纯单向的虽然链接文档知道它要链接到的地法,但被链接的文档却无法知道它是从何处被链接的,而这一点对于开发者往往是很重要的信息。SGML简介SGML是标准通用化标记语言(Standard Generalized MarkupLanguage)的简称,是一种用标记(tag)来描述文档资料的国际标准通用语言Web发明之前就存在了,是HTML和XML的基础。SGML中包含了一系列的文档类型定义(简称DTD),用于定义标记的含义,因

文档评论(0)

xingyuxiaxiang + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档