- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
信息检索 教 学 目 的 一、培养信息素养 二、增强主动获取信息的意识 三、提高信息收集和利用的能力 四、掌握计算机信息检索的基本技能 课程重要性 一、促进智力资源开发 二、协助管理者作出正确的决策 三、帮助研究人员继承和借鉴前人的成果,避免重 复劳动,少走弯路 四、节省研究人员查找信息的时间,提高科研效率 教 学 内 容 第一章 计算机信息检索基本知识 信息检索(Information Retrieval) 是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关的信息过程,所以它的全称又叫“信息的存储与检索(Information Storage and Retrieval),这是广义的信息检索 。狭义的信息检索则仅指该过程的后半部分,即从信息集合中找出所需要的信息的过程,相当于人们通常所说的信息查寻(Information Search)。 2 计算机检索原理 用户在计算机检索系统终端上,输入特定的检索指令(检索词或检索提问),计算机检索系统则根据指令要求从数据库中检索出用户所需要的信息,然后再由终端设备显示、下载或打印。 注意: 计算机检索的实质是类比、匹配,即从字面上进行对比,因而容易产生误检,这一点和手工检索不同。 信息需求(检索要求)必须用检索提问式的形式表达 3 检索提问式 亦称“检索表达式”,或“布尔逻辑表达式”,检索系统可执行的语句 由若干检索词按布尔逻辑组配关系构成 检索词——能够表达信息需求主要概念的词语,如:论文的关键词、作者姓名、作者单位、分类号等 布尔逻辑算符包括逻辑“与(and)”、逻辑“或(or)”和逻辑“非(not)” 检索式举例: 1、 关键词 =(通信 and 卫星) 检索字段 运算符 检索词 2、作者=李鹏飞and作者单位=(西安工程大学or西安工程科技学院or西北纺织工学院) 4 布尔逻辑“与” 算符表示方式有:“ and ” 、 “ * ” 、“并且” 等 含义是:检出的每一条记录中必须同时含有进行“与”运算所有检索词 基本作用是:对检索词表达的概念加以限定,缩小检索范围,提高检索结果的查准率。比较:“通信”和“通信and 卫星” 查准率=检出有关信息量/检出信息总量 逻辑“或”文氏图 6 布尔逻辑“非” 算符表示方式有:“ not ”、“ - ”、“不包含” 含义:从含有某个检索词的信息集合中排除含有另一个检索词的信息集合之后所剩余的部分,即检出的记录中只含有“ not”算符前的检索词,而不含其后的检索词 基本作用:缩小检索范围,减少信息输出量,但有排除掉相关信息的可能,慎重使用。 比较“通信”和“通信 not 卫星” 逻辑“非”文氏图 7 优先运算符“( )” 逻辑算符的优先执行顺序一般为NOT--AND--OR 优先运算符可改变上述逻辑算符的执行顺序 检索系统只认“( )”,不允许使用“[ ]”和“{ }” 比较检索表达式 A and ( B or C ) 和 A and B or C 运算顺序改变,则结果不同 A and ( B or C ) A and B or C 8 查准率与查全率的关系 查准率与查全率彼此有反比关系,查准率提高,查全率相应就会降低;反之亦然 影响查准率的因素是误检,影响查全率的因素是漏检 误检——检出有关信息的同时带出了不相关的信息 漏检——系统中存储的有关某一方面的信息没有被完全检出 误检会降低检索的效率,但不是影响检索质量的最主要因素, 而漏检才是影响检索质量的最主要因素,因此必须把它减少到最底限度 实际检索时要尽可能克服漏检,同时最好能避免误检,要适当选择出查准率和查全率之间的最优关系 查准率与查全率的反比关系 9 模糊检索 “模糊检索”与“精准搜索”是两个相对应的概念,模糊检索,亦称包含检索,即在返回的检索结果中您会发现:您输入的检索词包含在命中文献的检索字符串中。 例:输入作者姓名“张明”,在选择了“模糊检索”的情况下可检出作者为“张明”、“刘张明”、“张明丽”等人的文献。 输入题名为“计算机应用”,选择 “模糊检索”后可检索出《水泥厂的计算机应用技术》、《计算机应用中的几个问题》、《微型计算机应用于测量》等文章 与精确检索(检索词与命中检索字符串完全等同)相比,模糊检索能够扩大您的检索范围,提高查全率。 10 计算机检索步骤 (1)分析信息需求,确定
文档评论(0)