《网络信息检索与利用考察题》.docVIP

  • 197
  • 0
  • 约5.39千字
  • 约 9页
  • 2018-10-18 发布于四川
  • 举报
陕西师范大学网络教育学院 考 查 题 题 目 网络信息检索与利用 姓 名 学 号 专 业 批次/层次 指导教师 学习中心 《网络信息检索与利用》考查题 作业一: 简述信息检索的原理。 答:信息检索(信息检索),是指按照一定的方式组织信息,并确定根据用户的工艺和技术的信息需求的相关信息。信息检索是信息检索过程的后半部分窄,即找到处理从收集的信息所需的信息,也就是我们常说的信息检索(信息检索信息或寻求)。 从信息内容看有几类搜索引擎?各具什么特点并举例说明。 答:随着搜索技术的发展,搜索引擎商无不具有独门产品和技术,搜索引擎也进入细分化时期,种类越来越多.尽管数不胜数,但主要包括目录索引、关键词全文搜索引擎、元搜索引擎,以及由关键词全文搜索引擎扩展延伸的垂直搜索引擎、集合式搜索引擎、门户搜索引擎与免费链接列表等. 目录搜索的特点是考人工按照目录一层一层的查找,耗费时间. 关键(字)词搜索,以及以关键词组合为基础的全文搜索与目录搜索引擎相比,基于关键词搜索的优势是使用方便,搜索速度快,直接搜索内容,是目录搜索引擎无法比拟的. 其它不再一一列举,请在网上浏览新华云科论搜索引擎. 3、请说明一次文献、二次文献和三次文献的特点和功用。 答:一次文献也称原始文献,是指人们根据自己的科学实验、生产实践的成果而撰写的文献,一般指期刊论文、科技报告、会议论文、学位论文、专利等.二次文献也称检索工具,是指对一次信息加工、整理后形成的各种检索工具,如目录、题录、文摘等,它不对一次信息提供评论,仅仅提供一次文献的检索线索.三次文献是指在利用大量一次文献的基础上,对其内容进行综合、分析、研究和述评而撰写出来的文献.分为综述研究类和参考工具类两种类型.一次文献、二次文献、三次文献之间的关系:从一次文献到二次文献、三次文献就是一个由博到约、由分散到集中、由无组织到系统化的过程,也是科技文献资源的层次结构由无序走向有序、由一种有序结构演变为另一种完善的有序结构的过程. 4、简述搜索引擎的原理 答:(1)抓取网页。每个独立的搜索引擎都有自己的 HYPERLINK /item/%E7%BD%91%E9%A1%B5%E6%8A%93%E5%8F%96 \t /item/%E6%90%9C%E7%B4%A2%E5%BC%95%E6%93%8E%E5%9F%BA%E6%9C%AC%E5%B7%A5%E4%BD%9C%E5%8E%9F%E7%90%86/_blank 网页抓取程序爬虫(spider)。爬虫Spider顺着网页中的 HYPERLINK /item/%E8%B6%85%E9%93%BE%E6%8E%A5 \t /item/%E6%90%9C%E7%B4%A2%E5%BC%95%E6%93%8E%E5%9F%BA%E6%9C%AC%E5%B7%A5%E4%BD%9C%E5%8E%9F%E7%90%86/_blank 超链接,从这个网站爬到另一个网站,通过超链接分析连续访问抓取更多网页。被抓取的网页被称之为 HYPERLINK /item/%E7%BD%91%E9%A1%B5%E5%BF%AB%E7%85%A7 \t /item/%E6%90%9C%E7%B4%A2%E5%BC%95%E6%93%8E%E5%9F%BA%E6%9C%AC%E5%B7%A5%E4%BD%9C%E5%8E%9F%E7%90%86/_blank 网页快照。由于互联网中超链接的应用很普遍,理论上,从一定范围的网页出发,就能搜集到绝大多数的网页。 (2)处理网页。搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务。其中,最重要的就是提取关键词,建立索引库和索引。其他还包括去除重复网页、分词(中文)、判断网页类型、分析超链接、计算网页的重要度/丰富度等。 (3)提供 HYPERLINK /item/%E6%A3%80%E7%B4%A2%E6%9C%8D%E5%8A%A1 \t /item/%E6%90%9C%E7%B4%A2%E5%BC%95%E6%93%8E%E5%9F%BA%E6%9C%AC%E5%B7%A5%E4%BD%9C%E5%8E%9F%E7%90%86/_blank 检索服务。用户输入关键词进行检索,搜索引擎从索引数据库中找到匹配该关键词的网页;为了用户便于判断,除了网页标题和 HYPERLINK /item/URL \t /item/%E6%90%9C%E7%B4%A2%E5%BC%95%E6%93%8E%E5%9F%BA%E6%9C%AC%E5%B7%A5%E4%BD%9C%E5%8E%9F%E7%90%86/_blank U

文档评论(0)

1亿VIP精品文档

相关文档