网络信息组织与利用.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
网络信息组织方法 ——主题法 第二讲 传统主题法在网络资源组织中的应用 网络主题检索系统 主题语言在网络资源 组织中的应用 主题法是网络资源信息组织的一种主要模式。 在网络资源组织中,主题法的使用一般分为两种形式: 采用现有的词表,包括叙词表和标题表 广泛采用关键词法 高级关键词查询 区分大小写查询:有的搜索引擎能够区分检索词的大小写,将同一个词大写形式和小写形式视为不同的词进行查询。 自然语言查询:用户可直接用自然语言的字、词、句子作提问式,系统可以自动分析提问的要求,识别需要查询的关键词及词间关系。自然语言查询使检索变得直接、简单,特别适合非专业的检索者。 现有主题词表 在网络资源组织中的应用 目前,适用现有主题词表组织网络信息资源的还不多,主要是美国《国会图书馆标题表》(LCSH)和《医学主题词表》(MeSH)。 现有主题词表 在网络资源组织中的应用 采用LCSH: InterCat: A Catalog of Internet Resource (OCLC); Canadian Information By Subject(Library and Archives Canada) 现有主题词表 在网络资源组织中的应用 采用MeSH的有: CliniWeb Browse (Oregon Health Sciences University) OMNI (Organizing Medical Networked Information) http://omni.ac.uk/browse/subject-listing/alphalist.html http://omni.ac.uk/browse/mesh/a.html 网络主题检索系统 网络主题检索系统概述 索引模块的结构组成 关键词索引的查询、检索提供和优化 词汇控制 链接控制 关键词搜索引擎的特点及发展前景 网络主题检索系统概述 网络主是检索系统的特点 网络检索系统的类型 关键词搜索引擎的组织特点和要素 网络主是检索系统的特点 概念:网络主题检索系统是一种直接通过表达信息内容特征的词汇,对网络信息进行检索的工具总称。关键词搜索引擎是典型代表,起源于1994年的webcrawler.随后有lycos,excite,infoseek,alta vista等。 网络主是检索系统的特点 优点: 可以直接使用检索的对象进行查找 通用性强。可以使用自然语言 专指度高。直接检索特定内容对象的信息 信息量大,时效性强。使用机器采集,成本低,及时快捷 网络主题检索系统的特点 不足点: 缺乏系统检索能力。族性检索差 信息质量缺乏控制,查准率低 检索需要掌握技巧。 网络检索系统的类型 根据标引语言:自然语言系统和控制语言系统 根据处理的信息对象:综合性、专业或专类(学科)、专门(如视频等)主题检索工具 关键词主题检索工具是网络组织的主流 关键词搜索引擎的组织特点和要素 特点 后组。信息组织只提供了组织的基础和进行各种检索操作的可能。由用户在检索阶段实施组配 自由组配。组织的限制小,无定式 隐含。不可浏览,只在检索相应的部分 关键词搜索引擎的组织特点和要素 直接构成成分 索引及相关工具:基础结构,由索引模块建立 检索界面及提供方式:是根据用户需要确定的实施组织的条件和形式 检索优化:重组机制。 关键词搜索引擎的组织特点和要素 组织要素 词法 句法 其它相关要素,如链接、用户因素。 算法 索引模块的结构组成 索引模块是主题搜索引擎组织和检索的基础,通常应根据网络信息的特点烽检索的需要建立并结合适合的技术加以实现, 关键词搜索引擎索引的构成 网络信息的数据特点 关键词搜索引擎索引的构成 关键词搜索引擎建立的索引以及相关工具包括: 顺序索引:以信息为中心建立,将所采集的网络信息顺序编号 倒排索引(内容索引):以索引词为中心建立倒排列表的集合,每个词后是一个经过排序的列表,记录词在网页中出现的次数、位置及其它信息。网页以标识语言,可依据标识语言对网页结构的记录获取相关信息 结构索引(链接索引):根据网页的链接资源建立的索引 实用索引:结合搜索引擎检索界面提供的实际功能建立的索引 用户日志:记录用户的操作数据 辅助词典和工具。 网络信息的数据特点 搜索引擎的组织效果与索引和索引的数据特点相关,因此网页数据成分及其质量在相关性处理上占有重要位置。 作为相关性处理和组织依据的因素涉及多种成分:html,标记,url,链接,锁定文本,相应的目录数据,日志等。 网络信息的数据特点 网络信息数据与传统信息数据处理因素比较 关键词索引的查询、检索提供和优化 查询 检索排序和算法 优化

文档评论(0)

gpcjc1996 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档