数字信息资源处理技术分析.ppt

第4章 数字信息资源处理 教学目标 了解数字信息资源的有效处理是数字图书馆支撑技术之一 掌握相关信息资源处理所用到的技术,如: 信息资源描述技术 元数据技术 分词技术 文本分类技术 信息抽取技术及其具体技术 第4章 数字信息资源处理 教学要求 §4.1数字信息资源描述与组织 描述语言及其发展      Web实现了网页的连通,Web改变了人们学习与生活方式。HTML(超文本置标语言)技术拉近了Web与人们之间的距离,通过它很容易、方便地获得信息资源; HTML是SGML(Standard Generalized Markup Language,标准通用置标语言)的一个实例化的子集,可扩展性差,用户根本不能自定义有意义的置标供他人使用,这一切都成为Web技术进一步发展的障碍,在这种情况下XML顺应而生; 1969年,IBM公司就开发了一种文档描述语言GML用来解决不同系统中文档格式不同的问题,GML是IBM许多文档系统的基础,包括Script和Bookmaster,1986年该语言演变成一个国际标准(ISO8879),并被称为SGML; SGML是很多大型组织,比如飞机、汽车公司和军队的文档标准,它是语言无关的、结构化的、可扩展的语言,这些特点使它在很多公司受到欢迎,被用来创建、处理和发布大量的文本信息。 在1989年,在CERN欧洲粒子物理研究中心的研究人员开发了基于SGML的超

文档评论(0)

1亿VIP精品文档

相关文档