- 5
- 0
- 约2.84千字
- 约 13页
- 2026-04-12 发布于辽宁
- 举报
2026年单词统计考研真题及答案
一、单项选择题(每题2分,共10题)
1.在单词统计中,词频最高的单词被称为
A.基础词
B.高频词
C.低频词
D.专用词
答案:B
2.下列哪个不是常用的单词统计方法?
A.词频统计
B.词性标注
C.主题模型
D.词嵌入
答案:C
3.在处理大规模文本数据时,哪种数据结构最适合用于存储单词?
A.数组
B.链表
C.哈希表
D.树
答案:C
4.词频统计中,词袋模型的主要特点是什么?
A.考虑单词的顺序
B.不考虑单词的顺序
C.只考虑高频词
D.只考虑低频词
答案:B
5.下列哪个不是词性标注的常用算法?
A.基于规则的方法
B.机器学习方法
C.深度学习方法
D.词嵌入方法
答案:D
6.在单词统计中,TF-IDF的主要作用是什么?
A.提高词频
B.降低词频
C.衡量单词的重要性
D.衡量单词的稀有度
答案:C
7.下列哪个不是常用的文本预处理方法?
A.分词
B.去停用词
C.词性标注
D.词嵌入
答案:D
8.在单词统计中,n-gram的主要作用是什么?
A.提取单词的上下文信息
B.提取单词的语义信息
C.提取单词的语法信息
D.提取单词的统计信息
答案:A
9.下列哪个不是常用的词向量模型?
A.Word2Vec
B.GloVe
C.Fa
原创力文档

文档评论(0)