信息检索chapter.ppt

  1. 1、本文档共51页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
信息检索chapter.ppt

本课程特点 基本原理+广泛实践; 课堂上:以学习和了解信息检索工具背后的基本原理和技术为主,鼓励进行深层的研究或相关的开发应用; 上机:主要熟悉各种信息检索工具及其用法,强调检索能力的培养。 Modern Information Retrieval Chapter 1 Introduction 2009.09 Chapter 1 Introduction 教学目的与要求: 1.Make students comprehend past, present and future of IR 2.Make students familiar with data retrieval 3.Make students master basic concepts and the retrieval process 教学内容: 1.Motivation 2.Information Retrieval at the Center of the Stage 3.Basic Concepts 4.Past,Present and Future 5.The Retrieval Process 重点与难点: The Retrieval Process 互联网带来的问题 一方面,人们可以获得的信息的来源非常广泛。 另一方面,人们如何快速、准确、全面地获得自己所需要的信息? ??非常困难! ??信息量太大,而且信息冗余度大、质量良莠不齐、格式不一、位置分散、关联复杂、语言繁多 ??用户需求的表达和理解非常困难 ??信息的理解非常困难—自然语言文本、图片、视频 信息检索是研究如何解决上述问题的一门学科! Chapter 1 Introduction 1.1 Motivation(目的、动机) What is the definition of Information Retrieval? 1.1 Introduction Information retrieval (IR) deals with the representation(表示), storage(存储), organization (组织)of, and access(获取) to information items(信息项). Focus is on the user information need 即:从文档集合中返回满足用户需求的相关信息的过程。作为一门学科,是研究信息的获取、表示、存储、组织和访问的一门学问。 信息检索可以看成计算机科学(Computer Science)和图书情报学(Library Info. Science)的交叉学科。 ??以计算机为手段,处理信息对象 ??和其他学科也融合:语言学、认知科学、 ??检索来自英文单词Retrieval,有些人把它翻译成获取。其本义是“获得与输入要求相匹配的输出”。 用户需求(User Need,UN):用户需要获得的信息 ??严格地说,UN只存在于用户的内心,但是通常用文本来描述,如查找与2006世界杯相关的新闻,有时也称为主题(Topic) ??UN提交给检索系统时称为查询(Query),如2006 世界杯,对同一个UN,不同人不同时候可以构造出不同的Query,比如上述需求也可表示成2006 世界杯 新闻,Query在IR系统中往往还有内部表示 the example User information need: Find all docs containing information on college tennis teams which: (1) are maintained by a USA university and (2) participate in the NCAA(美国大学生体育协会national collegiate athletic association ) tournament(锦标赛). the key goal of an IR system is to retrieve information which might be useful or relevant to the user. Emphasis is on the retrieval of information (not data)。 1.1 Introduction 1.1.1 Information versus Data Retrieval what is the difference between them? the notion of relevance is at the center of information retriev

文档评论(0)

000 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档