2025年文本大数据挖掘技术研究生入学测试卷考核试卷.docVIP

  • 2
  • 0
  • 约3.17千字
  • 约 11页
  • 2026-05-31 发布于天津
  • 举报

2025年文本大数据挖掘技术研究生入学测试卷考核试卷.doc

2025年文本大数据挖掘技术研究生入学测试卷考核试卷

一、单项选择题(每题1分,共30题)

1.文本大数据挖掘中,用于表示文本数据结构的矩阵是?

A.协方差矩阵

B.协同矩阵

C.稀疏矩阵

D.矩阵分解

2.词嵌入技术中,Word2Vec模型主要解决的问题是?

A.文本分类

B.主题模型

C.词向量生成

D.情感分析

3.在文本预处理中,停用词指的是?

A.专业术语

B.高频词

C.低频词

D.名词

4.文本聚类中,K-means算法的主要缺点是?

A.无法处理高维数据

B.对初始聚类中心敏感

C.时间复杂度低

D.不能处理非欧几里得距离

5.LDA模型主要用于?

A.文本分类

B.主题模型

文档评论(0)

1亿VIP精品文档

相关文档