管理研究方法:理论、前沿与操作(第2版) 理论题参考答案.docx

管理研究方法:理论、前沿与操作(第2版) 理论题参考答案.docx

第11章大数据文本分析法-理论题参考答案

第一部分:概念解释题(共15分,每题3分)

题1-1:TF-IDF(3分)

参考答案:

定义:

TF-IDF(TermFrequency-InverseDocumentFrequency,词频-逆文档频率)是一种用于信息检索与文本挖掘的常用加权技术。它用于评估一个词对于一个文档集或语料库中的某一份文档的重要程度。

组成:

-TF(词频):表示词语在文档中出现的频率,计算公式为:

TF(t,d)=

-IDF(逆文档频率):表示词语的普遍重要性,计算公式为:

IDF(t,D)=

-TF-IDF:$TF-IDF(t,d,D)=TF(t

文档评论(0)

1亿VIP精品文档

相关文档