2026年单词统计考研真题及答案.docVIP

  • 5
  • 0
  • 约2.84千字
  • 约 13页
  • 2026-04-12 发布于辽宁
  • 举报

2026年单词统计考研真题及答案

一、单项选择题(每题2分,共10题)

1.在单词统计中,词频最高的单词被称为

A.基础词

B.高频词

C.低频词

D.专用词

答案:B

2.下列哪个不是常用的单词统计方法?

A.词频统计

B.词性标注

C.主题模型

D.词嵌入

答案:C

3.在处理大规模文本数据时,哪种数据结构最适合用于存储单词?

A.数组

B.链表

C.哈希表

D.树

答案:C

4.词频统计中,词袋模型的主要特点是什么?

A.考虑单词的顺序

B.不考虑单词的顺序

C.只考虑高频词

D.只考虑低频词

答案:B

5.下列哪个不是词性标注的常用算法?

A.基于规则的方法

B.机器学习方法

C.深度学习方法

D.词嵌入方法

答案:D

6.在单词统计中,TF-IDF的主要作用是什么?

A.提高词频

B.降低词频

C.衡量单词的重要性

D.衡量单词的稀有度

答案:C

7.下列哪个不是常用的文本预处理方法?

A.分词

B.去停用词

C.词性标注

D.词嵌入

答案:D

8.在单词统计中,n-gram的主要作用是什么?

A.提取单词的上下文信息

B.提取单词的语义信息

C.提取单词的语法信息

D.提取单词的统计信息

答案:A

9.下列哪个不是常用的词向量模型?

A.Word2Vec

B.GloVe

C.Fa

文档评论(0)

1亿VIP精品文档

相关文档