- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
元数据与网络信息资源引论
元数据与网络信息资源引论
1.1元数据的基础理论
网络信息资源呈现出动态性、分布性、多元性和无序性的特点。但综观网络信息资源现状,目前存在着严重的不规范、不准确、不开放等问题。因此如何制定和实施一系列准确、规范而且互操作性强的网络信息资源描述格式和组织系统成为一个重要的研究领域,并促成了元数据(metadata)的发展。
元数据是关于数据的数据1。一般分为描述性元数据、结构性元数据以及管理型元数据。本章重点对前两种元数据作归纳和分析。
1.1.1 描述性元数据
搜索引擎之所以具有强大的检索功能,就在于它可以对网站实施“地毯式”搜寻。搜索引擎在帮助用户寻找所需信息方面发挥了重要作用,但在返回搜索结果时候却不能满足用户需求。原因就是信息资源的提供者只重视信息资源的内容,而忽略了信息资源的描述。正是在这种背景下,产生了描述性元数据。描述性元数据的典型代表是都柏林核心元素集(Dublin Core Element Set,简称DC)。
1.1.2 结构性元数据
结构性元数据就好比文献著录中的著录格式2。结构性元数据也称置标语(Markup Language),因为它们用来定义各种描述性元数据的句法结构。置标语言根据其用途可分格式化置标语言(Formatted Markup Lan2guage)、专用置标语言(Specific Markup Language)、通用置标语言三种(Specific Markup Language)。随着网络的快速发展,面对新的复杂的应用需求。万维网协会(World Wide Web Consortium,简称W3C)于1998年2月推出了可扩展置标语言(Extensible Markup Language,简称XML)。需要指出的是:
(1)基于XML的元数据本身也有一个不断发展的过程。
(2)RDF是XML的一个实际应用,它为元数据的编码、交换、计算机处理提供了一个统一的语法架构,使目前网上种类繁多的元数据格式可以使用同样的结构,方便了互相之间的转换和交流。鉴于W3C的影响,RDF极有可能成为未来元数据的标准架构。
1.2元数据在网络信息资源中的应用
1.2.1 网络信息资源需要有效利用
我们现在生活在一个信息爆炸的时代,网络信息资源呈几何指数递增,如何从浩如烟海的网络信息资源中准确、全面地找到用户所需要的信息是目前网络信息资源利用中急需解决的问题。信息组织是网络信息资源有效利用的一个重要环节。只有经过良好组织的网络信息资源,才能更好地被人们查找和利用。
1.2.2 网络信息资源组织方式和要求
网络信息资源组织:是利用一定的规则和方法,通过对网络信息资源外在特征和内容特征的表达和归序。实现无序信息流向有序信息流的转换,从而保证用户对信息的有效获取和利用。
1.2.3元数据的作用
元数据在网络信息资源组织方面的作用3
(1)描述(Description)根据元数据的定义,它最基本的功能就在于对信息对象的内容和位置进行描述,从而为信息对象的存取与利用奠定必要的基础。
(2)定位(localization)由于网络信息资源没有具体的实体存在,因此,明确它的定位至关重要。元数据包含有关网络信息资源位置方面的信息,因而由此便可确定资源的位置之所在,促进了网络环境中信息对象的发现和检索。此外,在信息对象的元数据确定以后,信息对象在数据库或其它集合体中的位置也就确定了,这是定位的另一层含义。
(3)搜寻(Discovery)元数据提供搜寻的基础,在著录的过程中,将信息对象中的重要信息抽出并加以组织,赋予语意,并建立关系,使检索结果更加准确,从而有利于用户识别资源的价值,发现其真正需要的资源。
(4)评估(evaluation)元数据提供有关信息对象的名称、内容、年代、格式、制作者等基本属性,使用户在无需浏览信息对象本身的情况下,就能够对信息对象具备基本了解和认识,参照有关标准即可对其价值进行必要的评估,作为存取与利用的参考。
(5)选择(Selection)根据元数据所提供的描述信息,参照相应的评估标准,结合使用环境,用户便能够做出对信息对象取舍的决定,选择适合用户使用的资源。
元数据在网络信息检索方面的作用:
(1)管理大量低带宽网络的数据。
(2)支持有效的网络信息资源的发现和检索。
(3)标准的元数据描述允许比较、分享、集成和再利用不同类型的数据。
(4)元数据起到了看门人的作用,具有商业化信息资源不可缺少的作用。
1.2.4网络信息资源检索中存在的问题
目前网络信息资源检索的主要工具就是搜索引擎,它们大多采用基于因特网站点内容的全文标引方法,这已不是网络信息资源检索的最佳方法,结果是出现大量无用信息,甚至没有真正需要的信息。网络环境下信息资源组织呈现许多新的特点4
(1)信息数量大,种类繁多;
(2)内容丰富
原创力文档


文档评论(0)