第六讲:网络信息检索语言与技术.pptVIP

  1. 1、本文档共20页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第六讲 网络信息检索 之检索语言与技术 信息检索语言 检索语言的概念与作用 检索语言(information retrieval language)是信息存储与检索过程中用于描述信息特征和表达用户信息提问的一种专门语言,它是人与检索系统对话的基础。 例:一篇内容关于多媒体信息资源检索的文献A 信息存储过程: 篇名(title): A Model of multimedia information retrieval 主题(subject): information retrieval multimedia computer applications 作者(author): Cavern Jery 信息检索过程: 输入“information retrieval”:检索途径限定为“篇名”或者“主题”,文献A均在检索结果中。 信息检索语言 检索语言的类型: 人工语言 人工语言(artificial language)是根据信息检索的需要而由人工创制的,采用规范词(controlled term),用来专指某个概念或网罗与之相应的概念,可以将同义词、近义词、相关词、多义词及缩略词规范在一起,由人工控制,包括分类检索语言(分类号)、主题检索语言和代码检索语言。 1、分类检索语言 …… O 数理科学和化学 F 经济 P 天文学、地球科学 G 文化、科学、教育、体育 Q 生物科学 H 语言、文字 R 医药、卫生 I 文学 S 农业科学 …… …… 每一个大类又可以细分成若干个二级类目,二级类目还可以再细分。例如经济又可以划分为: F0 经济学 F3 农业经济 F1 世界各国经济概况、经济史、经济地理 F4 工业经济 F2 经济计划与管理 …… 2、主题检索语言 主题检索语言——由主题词汇构成,即将自然语言中的名词术语经过规范化后直接作为信息标识,按字母顺序排列标识,通过参照系统揭示主题概念之间的关系,也称主题法。包括先组式的标题词语言、后组式的单元词语言和叙词语言。主题语言表达的概念比较准确,具有较好的灵活性和专指性,不同的检索系统、不同的专业领域可以有各自的主题词表。 标题式语言 单元词 叙词 例子:Proquest检索数据库中的主题词列表 3、代码检索语言:就事物的某一方面的特征,用某种代码系统来加以标引和排列,目前主要应用于化学领域。例如,化合物的分子式索引系统、环状化合物的环系索引系统等。 主题检索在数据库平台中的应用 词表分为若干等级,上位词与下位词的位置。 每往下一级,主题词专指度更强,即查阅到的文献更准确。 同一等级下的主题词按字母顺序排列。 自然语言 自然语言(natural language)检索用词是从信息内容本身抽取的,主要依赖于计算机自动抽词技术完成,辅以人工自由标引(非依据词表的标引方法),是非规范词(uncontrolled term)。 自然语言的标识包括: (1)关键词(keyword):直接从信息资源名称、正文或文摘中抽出的代表信息主要内容的重要语词。这部分有时由人工自由标引进行,如期刊论文中的作者关键词,大部分由计算机标引系统自动完成 。 (2)题名:信息资源的名称,如论文篇名、图书书名、网站名称等。 (3)全文:从资源的全部内容中自动抽取、查找,是目前网上各类搜索引擎使用的最多的方法。 (4)引文:将文献所引用的参考文献的作者、篇名、来源出版物抽取出来进行标引。 人工语言与自然语言的关系 比较成熟的检索系统,通常是两种检索语言并用,互为补充,以保证较高的检索效率。例如在很多论文记录中,既有人工语言的分类法(Classification codes)、主题词(Subject headings)的使用,也包括自然语言的篇名(Title)、关键词(Key Words)、文摘(Abstract)等 两种检索语言的结合使用,给用户提供了更多的检索途径,使用户的检索效率更高,专指度、灵活度更好,保证了查全率和查准率。 主题

文档评论(0)

sdfgrt + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档