- 4
- 0
- 约1.12万字
- 约 27页
- 2026-06-15 发布于上海
- 举报
搜索引擎试题及解析
一、单项选择题(共10题,每题1分,共10分)
通用搜索引擎的网络爬虫模块核心工作目标是以下哪一项
A.存储互联网上所有公开和非公开的全部文件
B.按照预设规则抓取互联网公开页面的内容与基础属性
C.直接生成所有搜索结果的最终排序权重
D.自动过滤所有违反公序良俗的违规内容
答案:B
解析:正确选项B是爬虫模块的核心定义,爬虫需要遵循robots协议抓取站点允许公开访问的页面。选项A错误,爬虫无法抓取需要权限登录的非公开内容,也没有足够容量存储全互联网的全部文件。选项C错误,搜索结果排序由独立的排序算法模块完成,和爬虫模块相互独立。选项D错误,内容违规过滤由专门的内
原创力文档

文档评论(0)