16讲:主题标引-第10章.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十章 主题语言在网络资源组织中的应用 主题语言在网络资源 组织中的应用 网络信息的特点 主题语言在网络资源组织中的应用 网络信息组织方式 网络信息的特点 数量多,增长快,传播速度快 信息种类繁多:文本、图形、声音 网民有专门需求,要求信息组织方式透明化、易用化 信息形式的非线性、交互性和动态性 网络信息组织不能完全照搬传统的信息组织方式 主题语言在网络资源 组织中的应用 主题法是网络资源信息组织的一种主要模式。 在网络资源组织中,主题法的使用一般分为两种形式: 采用现有的词表,包括叙词表和标题表 广泛采用关键词法 关键词法在搜索引擎中的应用 主题语言在网络信息组织中的应用目前主要表现为关键词语言在网络搜索引擎中的广泛应用。 几乎每一个搜索引擎都具有关键词检索功能,这意味着搜索引擎的索引数据都采用了关键词法进行信息组织,也就是从网站、网页的题名、地址、摘要,甚至网页的正文中抽取关键词作为索引词。 关键词法在搜索引擎中的应用 不同搜索引擎提供的关键词检索功能不同,说明它们对关键词法的应用有一定差异。 网络搜索引擎的关键词检索功能:简单查询、高级查询。 简单关键词查询 直接在查询框中输入一个或多个关键词,系统按照自己的规则可能会将输入的关键词分解为几部分,并将包含每部分字符的信息都显示出来,也可能查出字面相同但内容相差很远的信息。 中文关键词查询以单汉字检索技术为基础时,获得的查询结果与查询要求可能相差更远。 高级关键词查询 布尔查询:大多数搜索引擎具有该功能,有的允许逻辑与、逻辑或、逻辑非三种逻辑运算,有的只能进行其中的一两种逻辑运算。大多搜索引擎采用命令方式,如AND、OR、NOT,或+、-,或将关键词之间的空格默认为逻辑与、逻辑或,有些用菜单选项进行。 高级关键词查询 精确查询:又称词组查询,将一个词组当作一个独立的运算(往往用双引号括起来),进行严格匹配,以提高查准率。 高级关键词查询 模糊查询:又称概念查询,不仅根据输入的关键词查询,而且会自动地用关键词的同义词、近义词进行查询,提高查全率。检索系统需配备相当于后控制词表的同义词、近义词词表。 高级关键词查询 截词查询:在搜索引擎中,目前大多只提供右截断法,截词符多采用“*”。 位置查询:目前只有少数搜索引擎具有该功能,而且大多数只有一种邻近位置运算,即Near运算。 高级关键词查询 字段查询:将关键词查询限定在特定字段。搜索引擎中,字段查询多表现为限定前缀的形式。主要限定的字段有:题名(title)、URL、主机名(host)、域名(domain)、链接(link)等。可提高查准率。 高级关键词查询 限制查询:将关键词限制在特定信息范围内进行查询。限制的信息范围主要有网络系统,如Web、Newsgroup、E-mail等;信息类型,如文本信息、图像信息、声频信息等;时间段及语种等。 高级关键词查询 管道查询:用管道符号“|”连接两个或多个关键词,查询时系统自动地先对前一个词进行匹配,然后在其基础上再对后一个词进行匹配,依次类推,以达到逐渐缩小检索范围,提高查准率的效果。 高级关键词查询 区分大小写查询:有的搜索引擎能够区分检索词的大小写,将同一个词大写形式和小写形式视为不同的词进行查询。 自然语言查询:用户可直接用自然语言的字、词、句子作提问式,系统可以自动分析提问的要求,识别需要查询的关键词及词间关系。自然语言查询使检索变得直接、简单,特别适合非专业的检索者。 现有主题词表 在网络资源组织中的应用 目前,适用现有主题词表组织网络信息资源的还不多,主要是美国《国会图书馆标题表》(LCSH)和《医学主题词表》(MeSH)。 现有主题词表 在网络资源组织中的应用 采用LCSH: InterCat: A Catalog of Internet Resource (OCLC); Canadian Information By Subject(Library and Archives Canada) 现有主题词表 在网络资源组织中的应用 采用MeSH的有: CliniWeb Browse (Oregon Health Sciences University) OMNI (Organizing Medical Networked Information) http://omni.ac.uk/browse/subject-listing/alphalist.html http://omni.ac.uk/browse/mesh/a.html 网络信息组织方式 文件方式:按文件名存取 数据库方式:结构化数据集合 主题树方式:分门别类,逐层组织 搜索引擎方式:主要组织方式。自动对网络资源采集、标引和检索。著名的搜索引擎:Google、Alta Vista、百

文档评论(0)

海川电子书城 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档