- 1、本文档共59页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第1页/共59页网络信息检索检索原理和搜索引擎第2页/共59页3333网络信息检索原理4315搜索引擎原理和概况2P2P搜索引擎使用方法网页搜索引擎使用方法网页搜索引擎简介门户网站和看不见的网站6本章内容第3页/共59页第一节 信息检索原理:关键词匹配原则第4页/共59页1、从“图灵实验”说起 大家都知道,计算机发展史上有一个重要人物图灵,他在上世纪50年代曾经提出了一个假想的实验,认为计算机可以具有人类的思维能力,被称为“图灵实验”。他并且预言,在20世纪末,具有人工智能的计算机将会出现。但时至今日,仍未有任何一台计算机能通过“图灵实验”。第5页/共59页2、计算机检索的奥妙:关键词匹配 计算机既然如此“无能”,连三岁小孩的智能都不具有,那么为什么人们要在网上查找信息,却总要通过计算机帮忙呢?计算机检索的奥妙在哪里呢? 原来,计算机实现检索的奥妙,就在于它能把你输入的检索词,与它后台数据库中存储的文件关键词进行比对,如果能够匹配,就认为这条信息是你需要的,立刻输出给你。第6页/共59页3、什么是信息检索?广义的信息检索:是指将信息按一定的方式组织和存储起来,并根据用户的需要找出相关信息的过程。 狭义的信息检索:一个匹配( Match)过程 即用户使用检索语言对自己的信息需求予以描述,并在一定的信息资源系统中进行描述匹配的过程。第7页/共59页“爱因斯坦论文”原始文献检 索加工整理提 问数据库检 索存 储输 出“爱因斯坦”“论文”“爱因斯坦”“论文”第8页/共59页4、信息检索原理信息的选择与收集信息源标识语言检索工具匹配信息特征数据库检索结果信息需求用户检索提问检索提问式第9页/共59页5、信息检索的要领What? Where? How?第10页/共59页6、信息检索类型依信息存储和检索的方式手工检索(Manual Retrieval) 也叫传统信息检索,是利用各种印刷型检索工具来查找文献的一种方法。计算机检索(Camputer-based Retrieval) 也叫现代信息检索,是指利用计算机和网络来处理和查找文献信息的检索方式。第11页/共59页7、主要计算机检索系统类型 检索系统由一定的检索设备(计算机)和经过加工整理并存储在相应载体上的信息集合及其他设备共同构成的具有存储和检索功能的信息服务系统。联机检索(online search)脱机检索(offline search)光盘检索(CD search)网络检索(Internet/Web search)全球数字图书馆系统(digital global system)第12页/共59页8、“关键词原则”是信息检索的根本原则四次文献三大系列中文网站两类搜索引擎Keyword原则第13页/共59页第二节 搜索引擎的原理和发展概况第14页/共59页1、网络信息资源种类WWW信息资源:web网页FTP信息资源:远程计算机上的文件夹Blog信息资源:博客、播客等等信息资源Telenet信息资源:直接调用远程主机BBS 、新闻组信息资源:相当于论坛信息P2P信息资源:私人计算机上的信息资源数据库和收费网站:如三大库三大馆第15页/共59页2、网络信息资源的特点信息量大、传播广泛信息类型多样、内容丰富信息时效性强、变化频繁信息分散无序、但关联程度高信息缺乏管理、良莠不齐 所以在网络信息检索中,我们常常要借助于搜索引擎来帮助我们“大海里捞针”。第16页/共59页3、搜索引擎的概念搜索引擎Search EngineInternet网络信息检索工具第17页/共59页4、搜索引擎的发展历史第18页/共59页Archie1990Gopher1993Yahoo!1994元搜索引擎1995Google1996Baidu1999……第二代搜索目录搜索搜索引擎发展历史第三代搜索网页搜索第19页/共59页搜索引擎的起源——Archie 所有搜索引擎的祖先,是1990年由蒙特利尔的McGill University三名学生发明的Archie(Archie FAQ)。Alan Emtage等想到了开发一个可以用文件名查找文件的系统,于是便有了Archie。Archie是第一个自动索引互联网上匿名FTP网站文件的程序,但它还不是真正的搜索引擎。Archie是一个可搜索的FTP文件名列表,用户必须输入精确的文件名搜索,然后Archie会告诉用户哪一个FTP地址可以下载该文件。 第20页/共59页早期的另一个搜索工具Gopher 由于Archie深受欢迎,受其启发,Nevada System Computing Services大学于1993年开发了一个Gopher(http://cnet.windsor.ns.ca/Help/Inet/gopher.htmlGopher FAQ)搜索工具Veronica(
您可能关注的文档
- 气管插管护理123.pptx
- 低位直肠癌保肛.pptx
- 部编版一年级语文上册日月水火.pptx
- 高压铸造常见缺陷及形成机理.pptx
- 浅谈洁净区人员及衣物管理.pptx
- 病理学基础文档资料.pptx
- 特发性正常压力脑积水的诊断和治疗.pptx
- 人教版七年级上册历史.pptx
- 妊娠合并内科疾病英文妇科八年制教学.pptx
- SCR催化剂脱销钛白粉实用总结.pptx
- 物业项目2024年全权管理权转让书3篇.docx
- 精神科护理(双语)(第2版)PPT课件 Chapter 10 Nursing Management for Clients with Neurosis.pptx
- 物业资产转让协议:2024年XX小区物业全权移交协议版B版.docx
- 物业综合管理合同20243篇.docx
- 独创技术成果转化协议样本版B版.docx
- 环保领域全面合作协议(2024版)下载范例1.docx
- 环保设备供货合同2024年通用.docx
- 环保设备定制采购协议样本版B版.docx
- 精算师考试内容持续更新的影响分析试题及答案.docx
- 环境保护与安全生产:2024年标准管理协议样本版B版.docx
最近下载
- 雅马哈船外机新F115A中文维修手册.pdf VIP
- 信息安全概论张雪锋第8章信息安全管理上课用课件.ppt
- 北京市大兴区2024_2025学年高三数学上学期期末考试试题.docx VIP
- 第四批黄鹤英才计划专项申请书创新人才项目填写说明..docx VIP
- 雅马哈船外机F15B中文维修手册.pdf VIP
- 水星船外机二冲程 15XD 英文维修手册.pdf VIP
- 水星船外机四冲程2.5_3.5 英文维修手册.pdf VIP
- 烟道安装施工方案.docx VIP
- 水星船外机二冲程 40-50-60-65-75-90-HP E-ETC 2010 英文维修手册.pdf VIP
- 信息安全概论 作者 张雪锋 第7章 网络安全技术.ppt
文档评论(0)