- 1
- 0
- 约9.69千字
- 约 24页
- 2026-04-07 发布于四川
- 举报
2025年搜索算法工程师试题及答案
一、选择题(每题3分,共30分)
1.在大规模分布式搜索系统中,以下哪种数据结构最适合用于倒排索引的存储与快速查询?()
A.红黑树B.跳表C.有序数组+内存映射D.哈希表
答案:C
解析:红黑树和跳表适用于内存中的动态有序场景,但面对亿级以上的词条规模时,内存占用过高且磁盘IO性能差;哈希表虽查询快,但无法高效支持范围查询和前缀匹配。有序数组配合内存映射(MMAP)可将磁盘上的有序索引段直接映射到用户进程地址空间,既能通过二分查找快速定位词条,又能利用操作系统的页缓存机制优化IO,是分布式搜索系统中倒排索引的经典存储方案。
2.关于BM25算法,以下说法错误的是?()
A.BM25是一种基于概率检索模型的排序算法
B.当文档长度越长时,BM25的文档长度归一化因子会对词条权重产生更明显的抑制
C.BM25的参数k1用于控制词条频率对权重的影响程度,k1越大,词条频率的边际增益越高
D.BM25会将文档中出现次数为0的词条权重设为负无穷
答案:D
解析:BM25的核心是基于“文档相关性与词条在文档中出现概率正相关”的概率假设,A选项正确;其文档长度归一化因子为(k1+1)tf/(k1(1-b+b|D|/avgdl)+tf),当|D|远大于avgdl时,分母显著增大,词条权重被抑制,B选项正确;k1控
您可能关注的文档
- 2025年四川省遂宁市政府采购评审专家考试真题(附含答案).docx
- 2025年四川省遂宁市政府采购评审专家考试真题库(带答案).docx
- 2025年四川省遂宁市政府采购评审专家考试真题库及参考答案.docx
- 2025年四川省雅安市法官逐级遴选考试题及答案.docx
- 2025年四川省雅安市检察官、法官入员额考试真题(附答案).docx
- 2025年四川省雅安市检察官逐级遴选笔试题目及答案.docx
- 2025年四川省雅安市检察院书记员考试试题及答案.docx
- 2025年四川省雅安市员额法官遴选面试考题及答案.docx
- 2025年四川省雅安市员额检察官遴选考试真题及答案.docx
- 2025年四川省雅安市政府采购评审专家考试测试题及答案.docx
原创力文档

文档评论(0)