- 3
- 0
- 约8.8千字
- 约 51页
- 2015-08-15 发布于湖北
- 举报
信息检索chapter.ppt
本课程特点 基本原理+广泛实践; 课堂上:以学习和了解信息检索工具背后的基本原理和技术为主,鼓励进行深层的研究或相关的开发应用; 上机:主要熟悉各种信息检索工具及其用法,强调检索能力的培养。 Modern Information RetrievalChapter 1Introduction2009.09 Chapter 1 Introduction 教学目的与要求: 1.Make students comprehend past, present and future of IR 2.Make students familiar with data retrieval 3.Make students master basic concepts and the retrieval process 教学内容: 1.Motivation 2.Information Retrieval at the Center of the Stage 3.Basic Concepts 4.Past,Present and Future 5.The Retrieval Process 重点与难点: The Retrieval Process 互联网带来的问题 一方面,人们可以获得的信息的来源非常广泛。 另一方面,人们如何快速、准确、全面地获得自己所需要的信息? ??非常困难! ??信息量太大,而且信息冗余度大、质量良莠不齐、格式不一、位置分散、关联复杂、语言繁多 ??用户需求的表达和理解非常困难 ??信息的理解非常困难—自然语言文本、图片、视频 信息检索是研究如何解决上述问题的一门学科! Chapter 1 Introduction 1.1 Motivation(目的、动机) What is the definition of Information Retrieval? 1.1 Introduction Information retrieval (IR) deals with the representation(表示), storage(存储), organization (组织)of, and access(获取) to information items(信息项). Focus is on the user information need 即:从文档集合中返回满足用户需求的相关信息的过程。作为一门学科,是研究信息的获取、表示、存储、组织和访问的一门学问。 信息检索可以看成计算机科学(Computer Science)和图书情报学(Library Info. Science)的交叉学科。 ??以计算机为手段,处理信息对象 ??和其他学科也融合:语言学、认知科学、 ??检索来自英文单词Retrieval,有些人把它翻译成获取。其本义是“获得与输入要求相匹配的输出”。 用户需求(User Need,UN):用户需要获得的信息 ??严格地说,UN只存在于用户的内心,但是通常用文本来描述,如查找与2006世界杯相关的新闻,有时也称为主题(Topic) ??UN提交给检索系统时称为查询(Query),如2006 世界杯,对同一个UN,不同人不同时候可以构造出不同的Query,比如上述需求也可表示成2006 世界杯 新闻,Query在IR系统中往往还有内部表示 the example User information need: Find all docs containing information on college tennis teams which: (1) are maintained by a USA university and (2) participate in the NCAA(美国大学生体育协会national collegiate athletic association ) tournament(锦标赛). the key goal of an IR system is to retrieve information which might be useful or relevant to the user. Emphasis is on the retrieval of information (not data)。 1.1 Introduction 1.1.1 Information versus Data Retrieval what is the difference between them? the notion of relevance is at the center of information retriev
您可能关注的文档
- 互普威盾代理含加密S.ppt
- 互普威盾网络保安PPT.ppt
- 互联网安全与防护第三版.ppt
- 互联网安全机制.ppt
- 互联网思维.ppt
- 互联网程序设计TCPIP协议.ppt
- 互联网络.ppt
- 五上复习数学,科学.ppt
- 五上科学反冲力,力的测量.ppt
- 五多重共线性.ppt
- 2025年版汽车趋势报告 The 2025 EPA Automotive Trends Report.docx
- 2026年边缘计算开源平台EdgeX Foundry入门与二次开发.docx
- 2026年超声内镜放大内镜早癌诊断AI辅助识别系统临床评价.docx
- 2026年报废汽车回收与再制造逆向物流体系.docx
- 2026年产品碳足迹核算方法学:从摇篮到大门与从摇篮到坟墓.docx
- 2026年城乡要素平等交换双向流动政策创新试点申报材料.docx
- 2026年超导半导体接口电路架构与电平转换驱动器设计.docx
- 2026年财政贴息不再以再贷款支持为前提后的风险防范与合规要点.docx
- 2026年不动产信托登记试点政策对遗嘱信托支持.docx
- 2026年城乡有机废弃物协同处理技术方案.docx
原创力文档

文档评论(0)