- 1、本文档共68页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
情报科学选择什么检索工具-超星慕课
如何组织存储这些检索标识? 数以亿计的网页、文本,如果组织不当,检索过程无法实施。 设有108网页,给定一个查询,每访问一个网页花0.0001秒,处理和比对时间花0.0001秒,则平均每个查询,用户需要等待:104秒! 事先下载、事先组织! 要能根据用户提交的查询词快速定位到哪些文档含有该查询词! 如何组织存储这些检索标识? 倒排索引 中国 文化 留学生 2 4 8 16 32 64 128 2 3 5 8 13 21 34 13 16 1 Dictionary Postings 修正用户的提问(关键词) 严格地说,我们的需要只存在于我们的内心,但是通常用文本来描述,有时也称为主题(Topic) 查一下温家宝总理与江西财经大学学生一起过除夕的情况 需要的信息一样,但不同人不同时候可以构造出不同的查询 温家宝总理与江西财经大学学生一起过除夕 温家宝总理 江西财经大学 除夕 温总理 江财 所构造的不同查询,会得到不同的检索结果 修正用户的提问(关键词) 用户通常“不能”准确表达自己所需的信息,有时甚至是“不可能”! 反馈机制 返回一些结果给用户,用户进一步判断哪些才是自己需要的; 检索工具由此获得更多关于用户真实需求的信息,用于进一步检索 如何对搜索结果进行排序 判断文本中有无查询词 如果两个文本都有,哪个文本更符合用户需求? 如果两个文本都只含有部分查询词,哪个文本更符合用户需求? 两个文本内容相近,一篇来自“人民日报”,一篇来自“南昌晚报”,你更倾向看哪篇? 如何对搜索结果进行排序 检索模型(不展开) 考虑关键词在文档中出现的次数、关键词区分文档的能力、文档的长度、关键词在文档中的位置… 链接分析 推荐你的人越多、越牛,你就越有价值 怎么知道这种比较方法的好坏? Baidu vs. Google 评测 评测数据 评测指标:召回率,准确率 小结 了解信息检索的方法 了解信息检索的途径 了解信息检索工具,并能利用常用信息检索工具进行信息检索。 了解信息检索工具的基本原理 政府出版物是指由政府机构制作出版或由政府指定出版商出版的文献。 政府出版物的特点 (1) 内容广泛,涉及各学科领域; (2) 资料可靠性强 (3) 售价低廉。 政府出版物 与标准化活动有关的一切文献都称为标准文献。其主体是标准,还包括标准形成过程的各种档案、宣传推广标准的手册及其它出版物。 标准是按规定程序制订, 经权威机构公认或主管部门批 准的在特定范围内执行的规格、 规则、技术要求等规范性文件。 标准文献 学位论文是指高等院校和科研单位中的本科生、研究生为获得学士、硕士和博士学位,在导师指导下完成的科学研究、科学试验成果的书面报告。 *1180年巴黎大学授予了第一批神学博士学位。 *学位论文答辩制度是由德语国家首创的。 学位论文 专利文献是记录有关发明创造信息的文献,蕴含着技术信息、法律信息和经济信息。广义的专利包括专利申请书、专利说明书、专利公报和专利检索工具,以及与专利有关的一切资料;狭义的专利仅指各国专利局出版的专利说明书。 专利文献 信息检索工具的类型 按照处理信息资源的手段 传统检索工具(或手工检索工具) 面向计算机与网络的检索工具 按照载体形式 书本式检索工具 卡片式检索工具 缩微式检索工具 胶卷式检索工具 磁带式检索工具 按照记录格式 目录型检索工具 题录型检索工具 索引型检索工具 文摘型检索工具 全文型检索工具 传统检索工具 传统检索工具主要是各种类型的工具书。 工具书是根据一定的需要、比较完备地汇集某一方面的资料,并按特定的方法加以编排,专供读者检索查考有关知识、资料或事实的书籍。 主要工具书 检索性工具书、参考性工具书、词语性工具书、表谱性工具书、图录性工具书和边缘性工具书 。 面向计算机与网络的检索工具 面向计算机与网络的检索工具主要包括联机检索工具、光盘检索工具和因特网检索工具等三种工具。 面向计算机与网络的检索工具 联机检索 指用户使用终端设备,按规定的指令输入检索词或检索参量,通过通信线路或通信网络查找近在眼前或远隔重洋的计算机数据库系统中的信息。 面向计算机与网络的检索工具 光盘检索 摆脱了联机检索时主机的约束,不受通信条件的限制 检索途径完善,检索功能强大,能提供题名、著者、主题词、关键词、号码、年代、出处等多种检索途径。 面向计算机与网络的检索工具 因特网检索 传统工具:远程登录、文件传输服务、电子邮件等。 基于Web的检索工具 :搜索引擎、网络资源指南、元搜索引擎和检索代理、书目检索系统、全文检索系统、多媒体检索系统等。 信息检索的过程 信息检索的过程就是根据用户对信息的需求,利用检索工具查找有关信息资料的具体过程。 分析用户信息需求 选择检索系统和工具 确定检索方法和途径 实施检索策略
文档评论(0)